舆情服务

  1、舆情监控系统

  【1】监测渠道

1.png

  支持新闻网站、论坛、博客、微博、微信公众号、贴吧、平媒电子版、新闻APP等不同渠道的信源采集。

  (1)网站:覆盖12万多家新闻网站,包括财经门户网站、互联网金融专业网站、网贷专业网站、各地新闻类网站的金融财经频道等;

  (2)论坛:10000多家论坛,包含网贷之家、网贷天眼等金融类主流论坛;

  (3)微博:监测14亿+微博账号,每天1亿的数据量,90%在1分钟抓取,99%在30分钟以内;

  (4)贴吧:2200多万个贴吧;

  (5)报刊:2000多家电子报刊,覆盖全国31个省(区、市)发行量较大的财经、都市类报纸、期刊、杂志等;

  (6)博客:400多家国内主流博客;

  (7)新闻APP:400多家

  (8)视频:60多家主流视频平台;

  (9)问答:知乎、百度知道等30多家主流问答平台。

  (10)微信:2000万微信公众号。

  【2】采集技术优势

  采用先进的分布式架构,可以抓取海量的网页,消除单点抓取瓶颈。集群的日抓取能力达到1亿以上。并且通过抓取流量控制,IP资源池等策略,可有效防止屏蔽。同时通过智能的调度机制,可自动调整抓取周期,优先抓取更新频繁的网页,保证抓取时效性。

1.png

  【3】数据存储

  基于Hadoop分布式存储框架,利用HBase分布式数据库,采用横向扩展的集群架构,系统容量与性能可随存储节点数目线性增长,突破扩展瓶颈。存储节点随用随加,可按需在线完成系统扩展,并自动均衡数据,提供具有高可扩展、高性能、高可用的数据存储。

  【4】智能文本分析

  基于百分点文本分析系统,融合了多种先进、经典的机器学习算法,采用深度学习并结合独创的业务分析模型,优化分析结构和分析方法,使中文情感倾向性分析的准确率和分析效率方面得到很大提升,保证高效、准确地完成分析判断。

  【5】数据导出

  对于查询出来的数据,支持一键导出。导出内容包括发布时间、标题(带有超链接)、摘要、链接地址、渠道、网站、原始来源、情感、字数、关键字(包括出现次数)、作者、微博博主粉丝量、博主身份、城市、是否认证、传播力指数(根据媒体权重、新闻转载量、情感属性、关键词密度等计算的综合权重值)
  【6】联系我们
  sitianjian@126.com

  司天监免费提供的行情数据以及其他资料均搜集整理自互联网,仅作为用户获取信息之目的,并不构成投资建议。司天监不为本页面提供的信息错误、残缺、 延时或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎
Copyright © 2018 www.sitianjian.com All Rights Reserved 浙ICP备17041212号-4