网络舆情文本挖掘与数据信息分析 – 厦门鹰犬网络舆情监测系统公司

网络体育彩票11选5开奖文本挖掘与数据信息分析

网络体育彩票11选5开奖文本挖掘与数据信息分析
2019年8月31日 No Comments 网络公关公司新闻 admin

网络舆论信息庞大而复杂,难以有效利用手工手段。 本文提出了一种基于模式匹配和机器学习(PMML)的方法来分析网络舆论的情绪倾向。 首先,提取舆论中的关键词,然后提取和匹配模式,计算单词的情感倾向,得到模式序列向量。 支持向量机(SVM)分类器用于分类情绪倾向。 以美团酒店的互联网评论为实验对象。 发现PMML方法具有较高的分类性能,最大准确度为86.75%。 它表明了该方法的有效性。 然后采用PMML方法对收集评论的情绪倾向进行分类,结果表明,负面情绪倾向大于积极倾向,显示了美团饭店的不足。 本文的实验为PMML在网络体育彩票11选5开奖情感分析中的应用提供了一定的依据。

1.简介
随着互联网技术的发展,社交网络已成为人们获取和交换信息的重要平台( Liu&Li 2010 )。 网络舆论已经成为舆论的主要来源( Li&Zhang 2014 ),也是人们在热点问题,社会政治等方面发表意见的主要平台( Tran&Tran 2017 )。 大量的网络舆论信息包含许多有价值的部分。 但由于网络体育彩票11选5开奖信息量大,复杂度高,使用普通分析方法无法从海量数据中有效获取有效信息,但数据挖掘的出现为网络体育彩票11选5开奖信息分析带来了新的方向。 网络舆论信息可以通过文本挖掘进行分析和利用( Guo et al.2014 )。 Liu( 2010 )提出了一种网络舆论热点检测方法。 首先,引入向量空间模型来表达文本格式,然后使用K-means算法对语料库进行聚类。 最后,使用支持向量机(SVM)分类器对文本进行分类。 陈等人。 ( 2016 )提出了一种基于协同过滤的网络体育彩票11选5开奖趋势预测方法,分析了其原理,构建了网络体育彩票11选5开奖趋势预测框架,并通过实验验证了该方法的有效性。 Yang( 2017 )采用改进的TF-IDF算法,引入了词性权重系数和特征词的位置权重,以提高网络舆论中特征词的聚类效果,更好地反映文本特征。 Wang&Tang( 2016 )提出了一种基于隐马尔可夫模型的语义指导分析方法,对网络体育彩票11选5开奖的情感取向进行分析和分类,发现该算法能够有效提高网络体育彩票11选5开奖分析的效率和准确性。 情绪倾向是指人们对某些客观事物的内心偏好和不喜欢。 情感取向分析是指通过分析和归纳网络产生的主观文本内容来挖掘用户对人物或事件的心理态度。 网络舆论的信息通常包括人们对事件的态度。 通过清晰的情感分析,可以获得人们对舆论的态度,这有助于引导舆论,有利于社会安全和稳定( Hao et al。,2015 )。 情绪取向分析需要基于大量数据,大数据时代使得分析情绪取向成为可能。 通过文本挖掘技术,可以处理自然语言文本以获得特定信息。 本文研究了网络体育彩票11选5开奖的情感倾向,模式匹配与机器学习方法相结合,利用PMML方法分析了网上美团酒店评价的情感倾向,验证了方法的有效性。

2.网络舆论与网络安全
舆论是指人们对事物的态度和情感,是人们思想状态的反映。 由于互联网的特殊性,互联网舆论也有一些特点。

普遍和匿名。 互联网上信息的传播非常迅速和广泛。 网民的发言可以在很短的时间内大大扩散。 由于网络的匿名性,言论自由更加突出。 在发表评论时,公众不择手段,这也使网络舆论变得更加复杂。

自由和可控。 互联网为人们提供了表达意见的平台。 互联网舆论比传统纸质媒体具有更高的自由度; 在那里,真假信息难以区分。 但网络舆论并非绝对自由。 某些管理和控制是非常必要的。 正确的指导也可以在网络舆论的指导下发挥一定的作用。

互动而直接。 网络平台为人们的信息交流提供了极大的便利,不仅在人与人之间,而且在公众与政府之间以及公众与媒体之间。 此外,网络的即时性也导致网络舆论的即时性和语音传输的及时性。

影响力很大。 由于上述特点,网络舆论的影响范围和程度非常巨大。 在网络舆论的影响下,热点事件可以在很短的时间内传播,但由于感情和态度的不同,事件将变得更加复杂。 真假信息会影响公众的判断,造成混淆。

复杂的网络舆论信息给网络安全带来了巨大挑战。 由于互联网的高度自由和开放性,互联网上的舆论是混乱的。 互联网上普遍存在大量的色情,反动或暴力信息,而互联网不仅使这些垃圾和有害信息迅速传播捷径,而且使得广大网民直接和被动地面对垃圾信息。
此外,互联网舆论的即时性和高影响力也对社会稳定构成了巨大威胁。 面对炙手可热的社会和政治问题,网民们可以在互联网平台上发表不受限制的演讲。 如果人们愿意利用互联网,他们可以将公众舆论引向一个不利于社会稳定和激发公众情绪的方面。 如果缺乏及时有效的控制,很容易使情况向坏的方向发展,形成网络突发事件,给国家和社会带来很大的负面影响。

基于文本挖掘的网络体育彩票11选5开奖情感倾向分析

目前,情绪倾向分析基于统计学,机器学习和语义学。 在本文中,模式匹配与机器学习相结合,模式匹配和机器学习(PMML)的过程如图1所示。

分类结果表明,具有消极情绪倾向的评论比例大于具有积极情绪倾向的评论。 这是因为大多数用户在生活经历不好或情绪不好时往往会在微博上抱怨,这也表明美团酒店因为许多问题而无法为用户提供良好的生活环境。 为了获得可观的发展,吸引新客户并留住老客户,美团酒店需要加强酒店管理,提高服务质量。

此外,29篇评论文本未被分类,表明情绪倾向分析的不足。 例如,有一个评论,“工作人员告诉我,当我预订时,酒店里有WiFi,但事实并非如此。”这条评论清楚地表达了一种贬义的情绪倾向,但无论是模式还是机器学习都无法识别和分析它。 由于网络舆论中语言表达形式的多样性,尤其是非标准语言的使用和网络词汇的存在,给文本挖掘技术带来了巨大的挑战。

5.讨论和结论
随着科学技术的发展,互联网逐渐成为舆论的主要摇篮( Song et al.2014 )。 随着互联网的发展和普及,网络舆论在社会中发挥着越来越重要的作用。 越来越多的网络舆论通过互联网成为社会舆论问题。 结果发现,网络舆论对社会事件的一半以上有贡献,积极的舆论可以引起社会关注,促进事件的解决。 但是,很难区分真假,并且舆论中存在有害信息。 由于网络的高度开放性和自由性,很难彻底根除有害信息,从而带来很多网络安全问题。 无尽的有害信息通过各种手段对人们的情绪和思维产生微妙的影响,并鼓励不正当言论的传播。 随着其发展,其影响力从网络延伸到现实,引起社会恐慌和动荡。 因此,网络舆论的影响不容忽视,大量的舆论数据信息需要用有效的方法进行处理和分析。 文本挖掘技术对网络体育彩票11选5开奖信息的分析有很大帮助。 网络体育彩票11选5开奖分析包括敏感问题挖掘,热点跟踪,趋势控制和情绪定向分析( Wang&Liu 2011 )。 通过对情感倾向的分析,我们可以掌握人们对人或事件的真实感受和态度,了解人们在当前政治中的地位,并做出符合舆论的决策( 罗2014 )。 分析热点新闻的情绪倾向可以引导舆论,稳定社会秩序,防止不良评论。

为了有效地分析互联网上的舆论信息,本研究提出了PMML。 首先,通过提取关键字建立模式库。 然后,计算关键字方向和图案方向。 最后,SVM实现了情绪定向分类。 为了验证该方法的有效性,本研究将情感取向归类于互联网上“美团饭店”的评价。 对于特征表示方法,比较了UniGrams,BiGrams和TriGrams,发现BiGrams方法与PMML结合具有最佳分类性能,前向准确率为86.75%。 因此,BiGrams用于文本分类。 结果显示,7892条评论中有35.02%为阳性,64.61%为阴性,29篇文本(0.37%)未被分类。 结果表明,该方法在评价酒店评论的情绪倾向方面具有良好的表现,消极倾向大于积极倾向。 调查结果令酒店经理们感到震惊。 敦促他们加强酒店管理,提供更好的服务。 29个未分类的文本表明该方法存在一些缺点,需要进一步研究,并且表明文本挖掘很困难。
网络体育彩票11选5开奖信息的情绪化倾向分析对于维护网络安全,促进社会稳定具有重要意义。 本文提出了一种基于PMML的方法来对网络舆论的情绪倾向进行分类。 实验表明,PMML与BiGrams特征表示方法相结合的准确率为86.75%,表明该方法可行,具有广阔的应用前景,增强了网络的协调性和安全性。

About The Author

Leave a reply

电子邮件地址不会被公开。 必填项已用*标注