项目展示

研究项目、个人作品与实习经历

🎵

基于情感分析的网易云音乐个性化推荐系统

本科毕业设计

毕业设计
2025
Python机器学习NLPFlask情感分析推荐系统

项目亮点

  • 基于 Python 爬虫采集网易云音乐热门歌曲及用户评论(20,000+ 条数据)
  • 融合 SnowNLP、情感词典、情感短语识别的混合策略进行情感标注
  • 对比评估朴素贝叶斯、SVM、随机森林三种算法,随机森林达到 83.52% 准确率
  • 设计三层匹配机制(情感类别 + 情感强度 + 多样性因子)实现个性化推荐
  • 基于 Flask 构建 Web 应用,集成词云图、混淆矩阵等数据可视化功能

后端框架

Python / Flask

机器学习

Scikit-learn

NLP 工具

Jieba / SnowNLP

数据处理

Pandas / NumPy

可视化

Matplotlib / WordCloud

📚

MyLibPro — 智能个人学术图书馆

个人项目

个人项目
2025
Next.jsReactTypeScriptGoogle GeminiSQLiteTailwind CSS

项目亮点

  • 融合 AI 深度研究与高性能全文检索的私有数字图书馆系统
  • 接入 Google Gemini 大语言模型,实现具备工具调用能力的 AI 研究助手
  • AI Agent 可自主搜索文献、阅读全文、记录笔记、管理 Token 预算
  • SQLite FTS5 全文索引,支持书名/作者/关键词/摘要联合检索,毫秒级响应
  • NDJSON 流式传输,前端实时渲染 AI 思考过程(工具调用可视化)
  • 会话工作区设计:维护活跃引用、阅读历史与研究笔记的完整状态

全栈框架

Next.js 16 (App Router)

AI 模型

Google Gemini API

数据库

SQLite + FTS5

前端

React / Tailwind / shadcn

类型系统

TypeScript

📄

Markdown 文档格式转换系统

实习项目 · 知译PDF

实习项目
2024
PythonFlaskPandocLaTeXBeautifulSoupDocker

项目亮点

  • 支持 Markdown → PDF / Word / HTML / LaTeX 四格式高保真转换
  • 内置多级容错降级机制(Pandoc → html→docx → python-docx),确保转换永不失败
  • 智能中文排版增强:自动检测语言并启用 XeLaTeX + CJK 字体引擎
  • 实现垂直参数表格自动重构为标准 Markdown 表格,处理复杂学术文档排版
  • 提供 Web 界面(支持最大 32MB 文件上传)与 CLI 命令行两种使用形态
  • 一键乱码修复:自动检测 GBK/GB2312/Big5 → UTF-8 转码

后端框架

Python / Flask

转换引擎

Pandoc / XeLaTeX

HTML 解析

BeautifulSoup4 / lxml

Word 处理

python-docx

图像处理

pdf2image / Pillow