Skip to content

微调AI的数字分身&长篇社会报告写作的感悟

柒柒最近用微调AI的方法,用个人聊天数据构建了个“数字分身”,虽然不太像我,但真的是我手调出来的,并且现在已经成功接入了qq。

作为一名高中生,也是第一次接触到这些时代前沿的项目,获得了许多崭新的体验。下面我会详述一下笔者的收获和一些感想~

笔者认为这个项目的难度为4.2/5,但是现在看来还是虚高了一些,原因是它的步骤很清晰:租服务器(Autodl)→下依赖(venv+uv)→数据集导入和预处理(Pywxdump)→微调ai(WeClone+llamafactory)→把ai接到中转站上(AstrBot)→把中转站连到平台上(NapCat, 钉钉开放平台,etc. ),并且难度全是初学各种别人做的工具带来的,不用自己创造轮子就很好。

相关收获:

  • 怎么优雅地抄作业(信息的搜集能力)
  • Vscode的一些操作
  • SSH的基本操作和隧道转发
  • 一些下载和微调AI类型的库的使用
  • 一些端口与网络知识
  • AI运行的背后细节

做IT就离不了debug。大量时间花在了一个模型不支持image的bug上,但是我的数据集根本就是全文字的,最后筛选出了一个单独的问题聊天记录才告解决。还有就是4090都不够的显存,乌龟的下载速度,以及各种依赖没下完整导致的错误。这块是真的考验毅力。

这个项目笔者觉得还是意义还是很足的。试想我有一天离开了,但是我的数字分身还始终存在,可以一直陪伴那些爱我的人;以及,就是用在一些心理援助方面,给那些需要的人更加拟人的情感支持。(也是我的愿景)

去尝试这种AI项目也是十分有意思的,从中我也是清晰感受到了“时代的脉搏”与“科技的涟漪”,努力去做一个各方面都与时代接轨的人~


最近我也第一次进行了长篇的非虚构内容写作,

药物滥用白皮书

之所以这么说是因为我3年前写过3.5w字的一部创意小说,并且药物滥用白皮书的word count也已经超过了2w。(只剩下了最后一章了,马上就能写出来)

将时间倒回一年前,怎么接触到odwiki的记忆已经模糊,但是我仍然记得我看到Rp49和Rp50两则报告(都在2025药物滥用白皮书 \ 附录:个人案例&调查统计里)时的震惊,无力和感慨。

我的家庭很美满,因此这也是我第一次如此真实地看到生死离别;同时无论是寒还是后藤,他们的能动与影响力都令我震惊。

认识到自己有改造世界的潜力或许正是进步的开始。mtfwiki和odwiki,搭建网站汇集知识的能力,我学会了搭我的网站交流能力与网络影响力,我也有了不错的收获,周记W25.28的后半部分已经有所提及;逊色的,也只有现实影响力这点了,但我和他们两人的环境都不一样,处在一所上海市中考录取分排名第五的学校,我周围和他们类似的人极少。

但是……我依旧想用一些方法弥补这点,解决我的心结。于是就有了这系列文章。写这种长篇社会报告也属实给我带来了很多崭新的体验与感悟,也让我反思很多不足。

通过输出,我发觉脑中“我以为我知道了”的虚假知识还是太多了,并且还没有构建起足够好的体系。写作中常常会出现列出了一个小点之后脑袋空空,不知道怎么拓展的情况。必须告诉自己,能输出的知识才是真正掌握了的,日常聊天中能想到的观点才是真正内化了的。

我希冀我的文章能够体现出一些专业性和深度,但结果似乎仅有广度而未挖深,原因是对个人阅历尚浅,知识面有局限——社会学和心理学未有学习(另:我也不打算将其作为我的未来专业)导致的心有余而力不足。

或许因而,我对自己这方面要求不太符合实际了。4.2部分是我摘抄改编来的,可以看出和我的风格有明显的差异。专业性有高度概括和表述准确的好处,也能为文章镀金,但仔细想来,实践性与理解便利性似乎也不错?

毫无疑问,最好的文章可以深入浅出,兼顾两者,要在未来自己感兴趣的专题达到这点,增加自己阅读的广度和深度(请教一些大佬是快捷的方法),并且长期写作也是必须的。

这系列文章还有非常多的不足,权当是一次幼稚的尝试,咱也会继续open,继续改进!

后面就是一些日常向的双周总结啦 ~


完成的任务清单

输出流

  • 药物滥用白皮书的写作

输入流

  • 重构了个人博客,学了一点点前端
  • 学了怎么微调大模型,了解了一点点AI

作业流

稍微放了一放,是时候拾起来啦

  • 基本完成了物理作业
  • 复习了数学的导数 复数 解几
  • 复习了化学的有机部分
  • 地英两门的作业稳步推进

假期前半的时间管理

每天的屏幕时间大约为

  • 知乎2h(平均1h娱乐,1h输出)
  • 音游1h(音游真的很能解压,并且没有每日任务之类,因此能不过多浪费时间)
  • 浏览器1.5h(在看backrooms wikidot等创意性写作内容&b站视频,我不下b站手机版,但b站信息熵太高,是娱乐性的)

这么算下来,大约每天的娱乐时间在3-4h。我最早的时间规划中指出,1天14h,减2h内务,减3h娱乐,规划其中9h,这方面符合了我预先做的减法,完成的不错。


后续安排

作业流:

把重心放在数学和语文两门上面。

数学复习函数性质 幂指对 概统部分的几种分布 然后做综合卷

语文还不知道怎么复习,打算先按题型做起来,做了再说(向有经验的大佬求教ing)

输入流:

出去旅游的碎片时间用来看书。

阅读目标从3篇调整为2篇,因为去做了IT学习本来未规划的任务。

社交流:

已知的问题有——聊天过于严肃,整的和ai一样;对已有的观点仍然不善于提取;不擅长从他人身上得到总结和启发,第一想法仍然是驳斥。

另外正在考虑出cos。(有经验的请跟我聊聊,doge)

输出流:

知乎新长文写作的频率减少到一周一篇。

已有观点的分专题梳理和短视频发布。


假期过半,要继续努力啦~