conda create -n ML python=3.12 #这里的ML可以是自定义的环境名
conda activate ML
pip install -r requirements.txt
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
.dot文件为决策树可视化文件,例如:Decision_Tree_BOW.dot
.pkl文件为模型文件,例如:Decision_Tree_BOW.pkl
与模型文件同名的.py文件为该模型训练代码,例如:Decision_Tree_BOW.py
训练数据集weibo_senti_100k.csv,来自 https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets/weibo_senti_100k ,新浪公司在Github上开源的其旗下新浪微博公司匿名用户评论文本数据集“weibo_senti_100k.csv”并已经对每 条评论进行了情感标注(积极、消极)。数据集共119989条用户评论数据,其中59994条情感标注为“积极的用户评论,和59995条情感标注为“消极”的用户评论。
test开头的.csv为验证数据集,使用spider.py爬取,输入凤凰新闻链接,即可自动创建.csv文件,如果使用spider.py创建的文件命名后面会加上时间,例如:test_20240531172628.csv
使用TKInter完成前端编写,运行demo.py,即可使用,页面包括四个部分,分别是最上方的链接输入框,中间的模型选择下拉栏,中间的新闻评论情感分析预测输出框,下方的每日评论数量变化折线图和词云图。
选择预训练好的模型,再输入test文件,推荐使用test.csv,或者在线凤凰新网网址都可以,例如:https://sports.ifeng.com/c/8YRoRaeBxRf ,即可在一段时间之后输出最终预测结果
参考B站 黑马程序员Python教程,4天快速入门Python数据挖掘,系统精讲+实战案例
参考B站 尚硅谷Python爬虫教程小白零基础速通(含python基础+爬虫案例)
和ChatGPT的辅助完成,仅供大家参考