在实际使用的过程中,推荐用户优先定义数据源类型 , 用来限定该数据的适用范围;必要时还需自定义一些字段加工规则,用来和数据源类型进行一一对应 。

文章插图
2、数据处理流程(1) 数据导入鸿鹄系统支持各类数据源的自动化导入操作,通过数据采集器或数据连接器,将数据从不同的数据源拉取并汇总到鸿鹄系统中 。同时数据的格式也是多种多样的 , 包括文件类型、数据库类型、Kafka类型等 。
- 日志数据导入

文章插图
完成数据上传后,在预览界面选择自定义的数据源类型 。利用鸿鹄系统实现对时间字段的自动化提?。?⑼ü?だ朗?莸姆绞饺啡鲜奔渥侄翁崛〉恼?沸?。
- 设定目标数据集

文章插图
将数据存放在目标数据集中,如上图所示,支持通过数据源主机来区分不同的数据来源 , 以达到数据源区分的目的 , 避免混乱 。
- 数据导入验证

文章插图
- CPU监控数据
- 设定数据源类型

文章插图
由于CPU数据为csv文件,因此采用内置的csv数据源类型就可以进行导入(平台支持csv类型文件的时间字段自动识别功能) 。
- 设定目标数据集

文章插图
同样地,通过数据源主机以及数据源的方式,对数据来源进行区分 。
- 资产关系映射数据
- 构建“查找表”

文章插图
上图中 , 构建了fqdn、ip、service这3个查找表 。新建查找表的具体界面如下图所示 。
- FQDN <-> 系统 映射表

文章插图
- IP <-> 系统 映射表

文章插图
- URL节点<-> Web服务模块 映射表

文章插图
(2) 数据解析完成了数据的导入,下一步是解析数据,提取数据字段,为建模做准备 。对于本例中的数据格式,由于其是非结构化数据,故采用正则表达式的方式来提取字段 。在鸿鹄系统中,正则解析方式有两种实现方式:互动划词,和手动编辑 。
- 方式1:互动划词 (“数据管理” -> “字段加工” -> “新建规则应用”)

文章插图
- 方式2:手动编辑
推荐阅读
- 利用Java AOP实现面向切面编程的关键技术
- 微信聊天记录为何轻松占用100GB的存储空间?
- 6个简单步骤 轻松实现苹果微信双开
- 蝙蝠是超声波还是次声波,蝙蝠利用超声波还是次声波
- 废物利用创意小窍门有哪些 废物利用创意小窍门
- 王者荣耀上分技巧,如何在王者荣耀轻松上分
- 容易忽视的7个减肥误区,搞定它们,轻松瘦出“小蛮腰”
- Lisa利用完被抛弃?
- 空调有异味怎么清洗 空调有异味怎么清洗?十个步骤轻松清洗空调
- 核能发电原理,核能电池原理
