Skip to content

Anglejuebi/ML_SentimentAnalysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

此为本人本科毕业设计,仅供大家参考

使用SKLearn,WordCloud等库完成

具体演示视频可以看我发在bilibili上的视频 P1 大概五分半开始的演示

⚠⚠⚠ NEWS!

推荐将论文和PPT下载后再打开或编辑,尽管PPT嵌入了字体但是还是会出现字体显示错误的问题,可以自行更换显示错误的字体。

环境配置

这里以conda创建虚拟环境为例,如果你是使用conda创建虚拟环境,就从这里开始

conda create -n ML python=3.12 #这里的ML可以是自定义的环境名
conda activate ML

如果你使用的不是conda,就从这里开始,如果你使用的是conda,那就继续

确保你现在在项目根目录

pip install -r requirements.txt

如果出现网络问题,可以尝试使用镜像

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

文件说明

.dot文件为决策树可视化文件,例如:Decision_Tree_BOW.dot

.pkl文件为模型文件,例如:Decision_Tree_BOW.pkl

与模型文件同名的.py文件为该模型训练代码,例如:Decision_Tree_BOW.py

训练数据集weibo_senti_100k.csv,来自 https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets/weibo_senti_100k ,新浪公司在Github上开源的其旗下新浪微博公司匿名用户评论文本数据集“weibo_senti_100k.csv”并已经对每 条评论进行了情感标注(积极、消极)。数据集共119989条用户评论数据,其中59994条情感标注为“积极的用户评论,和59995条情感标注为“消极”的用户评论。

test开头的.csv为验证数据集,使用spider.py爬取,输入凤凰新闻链接,即可自动创建.csv文件,如果使用spider.py创建的文件命名后面会加上时间,例如:test_20240531172628.csv

使用方法

使用TKInter完成前端编写,运行demo.py,即可使用,页面包括四个部分,分别是最上方的链接输入框,中间的模型选择下拉栏,中间的新闻评论情感分析预测输出框,下方的每日评论数量变化折线图和词云图。

选择预训练好的模型,再输入test文件,推荐使用test.csv,或者在线凤凰新网网址都可以,例如:https://sports.ifeng.com/c/8YRoRaeBxRf ,即可在一段时间之后输出最终预测结果

学习路径

参考B站 黑马程序员Python教程,4天快速入门Python数据挖掘,系统精讲+实战案例

参考B站 黑马程序员3天快速入门python机器学习

参考B站 尚硅谷Python爬虫教程小白零基础速通(含python基础+爬虫案例)

和ChatGPT的辅助完成,仅供大家参考

About

Research on Machine Learning-based Sentiment Analysis Methods for News Commentary

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published