• 首页
  • 博客
  • 项目
  • 留言墙

动态更新

喜欢我的话可以订阅支持一下 (✧∇✧)
加入其他 0 位订阅者,每月一封,随时可以取消订阅。

© 2025 Jrenc. 网站已开源:GitHub

首页博客项目留言墙
  • 开始!
  • 时间节点
  • 毕业论文
  • HugLang
  • 雪巴科技
  • HugLang任务分解
【HugLang】项目日札
2025/05/06产品日记

【HugLang】项目日札

接下来对HugLang的项目进行详细的规划,要考虑雪巴的工作,毕设和HugLang的时间交错。

53次点击10分钟阅读

前两天五一放假,回家了几天,基本没写代码。

回来复工了,准备这两天把我的cursor的还剩下的370次用完,应该一天10个小时就可以了。

不闲扯了,接下来完成之后的功能路线图。

开始!

时间节点

毕业论文

- 5月15日 毕业论文初稿

- 5月30日 盲审抽检阶段

- 6月6日 评阅和答辩资格审查阶段

- 6月13日 第一次答辩

- 6月16日 评优阶段

HugLang

- 6月12日 奇迹创坛截止

- HugLang产品

雪巴科技

- iBoard大厦屏重构 雪巴科技

- iNtercom完善 雪巴科技

HugLang任务分解

- 语言脚手架

- 内容生成系统

- 插件生成系统

- 量化学习系统

....剩下的思考笔记转到飞书上了,因为只有文章的形式有点限制我的思考。

产品思考

所谓生词,熟词这种两级分化的单词标准根本是反用户的,一点不会是生词,偶尔能想起来是生词,记住一个意思是熟词,记住多个意思是熟词,记住多个意思的不同形式也是熟词...如果你做给用户让用户去决定是否复习的话这是没问题的,但是如果你要让复习自动化起来,那只通过生词熟词是完全无法应对其复杂度的。

当然自动化起来需要用户选择掌握程度,我选择二八定则,很多时候只需要让用户掌握80%就可以了,否则便变成了孔乙己的几种写法,除了掉书袋没有什么意义。

我们必须清楚的一件事是,世界是动态的,我们永远没有完美主义这种静态事物的出现,比起“完全掌握”这种词,够用是更应该被重视的解决答案。但是如果面对需要吊书袋的场景,或许它的够用就显得不够用了,我们可以通过不同的形式去确保它是可以被动态纠正的,通过插件模式去确保它可以被动态纠正,说的清楚点就是,因为插件可以决定你和不同的人对话,80%学会后一个单词的另外一个小众意思,你可以通过和小众插件对话后,他会在对话中提到这个小众单词,从而产生对话。如果这些还没有解决需求,我想这不是目标用户,因为我的产品也是二八定则的,我需要解决80%的问题,付出20%的努力。

其实HugLang分为三个部分,

第一部分是内容,内容可以是多个部分,新一点的有英文短视频,AGC-AI生成内容,老一点的有百词斩过去的图片+单词,还有多邻国的游戏化答题,他们本质上都是内容,提供的都是内容,是资料,是学习的内容,有的人喜欢听音乐,有的人喜欢看剧,这都是不同的学习内容的方式。我们并不一定说这个内容就一定比另外内容好,而是分人,让每个人选择自己感兴趣的内容是很合理的。

第二部分是脚手架,脚手架是让用户实现N+1的核心。他其实在AI时代相当于1V1助教,可以让人帮助人答疑解惑,同时让他实现N+1,N+1的核心其实是可接受而不是只能多一点点,而脚手架的作用就是将N+M的内容变成可接受的内容。

第三部分是量化学习系统,量化学习系统的核心是通过算法去让用户去学习此时最适合学习的系统,过去也有量化学习系统,比如百词斩,多邻国,但他们的量化学习系统是简单的,因为它的内容系统也是单薄的。现在市面上最好的量化系统是抖音,小红书等等的推荐算法,但也是上个时代的产物了,新时代的量化系统应该在推荐算法的基础上结合AGC+用户画像。

王者荣耀打造了一个没有人也可以对战的5V5游戏,而小红书其实也可以打造一个没有启动用户也可以刷的网站。或许AI生成内容是一个好的商业Idea,可以让AI去辅助软件进行冷启动的内容生成。当然manus,MCP或许可以完成这个任务。

说远了,量化学习系统的定位是去根据用户的学习情况,任务进度去获取用户最应该学习的单词,短语,语法,然后去输入给内容系统,让内容系统生成/挑选合适的内容给用户。

这是三个核心的模块,其他的模块可以等一等。

我最近在彻底完成对HugLang的重新构思,我发现我现在更偏ENTP的做事风格,我之前觉得自己是ENTJ是认为自己会在做事前都计划好,但发现其实我都是干中学的。

复习的流程是什么呢?什么是复习呢?

复习的本质是让用户接收到可学习的内容。但可学习也有轻重缓急,我们希望用户学到最应该学的,最应该学的评判标准有哪些?当然不同的方法有不同的评判标准,单词,短语,语法的评判标准不应该是一样的。大多数情况下单词和短语的评判是有些相像的,但是语法可以单拎出来。所以我们优先讨论单词和短语的评判标准。


单词和短语如何用一个标准去衡量最应该学?

  • 重要性 (Importance/Relevance):
    • 高频性: 内容在目标语言的日常交流、特定语料库(如考试大纲、专业文献)中出现的频率。频率越高的内容,用户在实际中遇到的可能性越大,掌握后收益也越高。
    • 核心性/基础性: 是否属于构成语言理解和表达基础的核心词汇、短语或语法结构。掌握这些基础内容是进一步学习的基石。
    • 与用户目标的相关性: 内容是否直接服务于用户的学习目标,例如备考特定考试(四六级、托福、雅思)、商务沟通、学术研究、日常生活等。
    • 实用价值: 内容在特定场景下的实际应用价值。例如,对于旅行者,“问路”、“点餐”相关的表达比生僻的文学词汇更具优先性。
  • 遗忘曲线与复习时效性 (Forgetting Curve & Review Timeliness):
    • 临近遗忘点: 根据间隔重复理论(如艾宾浩斯遗忘曲线),那些用户学习过但即将到达最佳复习时间点的内容应被优先推送。此时复习,可以用最小的努力获得最大的记忆巩固效果。
    • 错误率/掌握程度: 用户在过去的学习或测试中频繁出错、或系统评估为掌握程度较低的内容。这些是用户的薄弱环节,需要优先加强。
  • 学习者状态与个性化 (Learner Status & Personalization):
    • 当前水平与“最近发展区”: 推送的内容应略高于用户当前水平,即处于其“最近发展区”(Vygotsky's Zone of Proximal Development),既有挑战性又能通过努力达到,从而最大化学习动力和效果。
    • 用户显性偏好: 用户主动标记为“重要”、“想学”或收藏的内容。
    • 学习历史与模式: 分析用户的学习历史,识别其习惯、兴趣点以及对某些类型内容的接受度,进行智能推荐。例如,如果用户最近在学习某个主题的词汇,可以优先推送相关的扩展内容。
  • 内容本身的特性 (Intrinsic Content Characteristics):
    • 认知负荷: 避免一次性推送过多高难度或全新的内容,以免超出用户的认知负荷,导致学习效率下降和挫败感。应在新旧知识、难易程度上取得平衡。
    • 关联性与结构性: 新学习的内容如果能与用户已掌握的知识建立联系,或者属于某个结构化知识体系(如词根词缀、同义词反义词群组),则更容易被理解和记忆。

把量化学习逻辑重构了一遍,算是理清楚了。感谢Gemini 2.5 pro exp 0325,他真的很聪明,很博学,很认真的对待我的问题。有些想写论文致谢了,感觉论文致谢类似于“领奖感言”,属于人生的闪耀时刻。因为我真的在认真思考去设计HugLang,所以我很感谢。
我时常觉得认真是一件无穷尽的事情,人们永远只能趋于认真,也只能趋于努力,小时候父母告诉我尽力就好,可是真正尽力的人会发现,尽力是一个根本达不到的状态,因为人类的潜力是无穷尽的。当你一直奔向尽力的状态,等回头的时候发现原来自己已经走了这么远了。这个距离,曾经是想都不敢想的距离,但到达后发现,似乎还没有尽力,路上弯弯绕绕,踩了很多坑,但好像已经比大多数人走的快,走的远了。于是就懂了,Setbacks are unavoidable,but give up is unforgivable. 一团乱麻是常态,只要你一直去想,总有一天会理清楚的,相信相信的力量。

想起一个营销词,可以做入导航页中,“会与不会,This is stupid,不再纠结,精准描述你的学习状态”,可以优化一下,提个点子。

核心的记忆算法决定采用SM-2和FSRS,当然现在还是先采用SM-2的,FSRS需要积累一些用户数据。
再加个营销词,“不会的词不复习,会的词一直复习?使用机器学习拟合你的专属学习状态,每次学习都学到你的心啪上。”当然不一定采用机器学习,二八定则,Anki的SM-2会是暂时先选择的场景。
Think Different和老苹果的审美真的是顶级,新苹果也很好,但是还需要时间登堂入室。

终于把核心的三个模块简单思考完毕了,内容生成,脚手架以及量化学习。到了写论文和写代码的环境。开始写论文了。

思维图

相关文章

【HugLang】我们要解决什么问题?

2025/04/06产品日记285分钟阅读

【HugLang】产品日记3.21

2025/03/21产品日记338分钟阅读
总浏览量 1.2万
最近访客来自 Hefei, CN🇨🇳