简答题
某省自建网管系统每天产生大量网元级日志记录,省公司相关专业同事希望针对网元日志进行数据挖掘和在线分析,以优化网络运行状态,并且提前预测故障风险等。但是受限于投资规划和集团集约化运营要求,省内继续投入成本新建大数据系统周期长、见效慢。省公司领导希望借助中国联通网络数据平台能力实现省内业务场景需求。请基于你对网络数据加工处理的理解,为该省同事设计一套数据加工方案。
答案解析
正确答案:1,采集数据:省内做通网管系统日志存储单元和网络数据平台采集系统网络。通过ESB文件传输或Kafka实时消息系统将原始日志传送到总部;
2,清洗回填:利用Spark、Flink等计算框架运行数据入库任务。对原始日志进行清洗、回填等操作后入库到Hive数仓;
3,离线加工:根据省内实际业务场景设计数据加工算法,利用Spark等计算任务对清洗后数据进行进一步汇聚计算;
4,数据同步:利用网络数据平台数据同步工具将Hive数仓中的数据加工结果同步到ClickHouse等OLAP数据库;
5,在线分析:使用网络数据平台交互分析OBI工具或研发环境ODV工具连接ClickHouse数据库进行日常分析和数据挖掘。
2,清洗回填:利用Spark、Flink等计算框架运行数据入库任务。对原始日志进行清洗、回填等操作后入库到Hive数仓;
3,离线加工:根据省内实际业务场景设计数据加工算法,利用Spark等计算任务对清洗后数据进行进一步汇聚计算;
4,数据同步:利用网络数据平台数据同步工具将Hive数仓中的数据加工结果同步到ClickHouse等OLAP数据库;
5,在线分析:使用网络数据平台交互分析OBI工具或研发环境ODV工具连接ClickHouse数据库进行日常分析和数据挖掘。
题目纠错
相关题目
单选题
OLT 上PON口下行输出光功率为2.8dBm,在用户侧测得下行光功率为-19.8dBm,则该光路上的实际损耗为()
单选题
已上市的所有5G双卡手机都不能支持插入的两张卡同时登陆5G网络
单选题
用户可以自主设置将双卡手机所插入两张卡的任意一张卡作为移动数据流量主卡
单选题
已上市的5G手机中,双卡手机市场份额占比已经达到 ,因此需关注用户卡槽状态
单选题
以下哪些指标的增长不利于5G流量占比的提升?
单选题
5G流量占比的提升与以下哪些指标有关?
单选题
以下哪些措施有利于5G流量占比的提升?
单选题
推进5G端网业服协同,提升5G流量占比,应持续推进“三促”计划:促换机,加强终端产业牵引,提升5G终端渗透率;促登网,提升用户SA登网率;促驻网,提升5G业务流量驻留比。
单选题
5G流量占比是指全网5G流量占移网总流量的比例
单选题
以下哪些指标是新一代智慧经营分析系统5G终端登网匹配漏斗模型监控报表中指标?
