筷筷小报#9 - 祝各位 1024 快乐

Fri, October 25, 2024 - 13 min read

这周是 1024 节,大家过的怎么样呢?当日我司准备了个超大蛋糕,好吃😋

cake

工具推荐

1 rrweb

rrweb 指的是“record and replay the web”,是一个用于录制和回放用户在网页上交互的工具。

使用场景举例:

  • 保险行业录制用户网页交互行为作为存档;
  • 前端监控领域的错误上报和用户行为分析:
    • 前端错误发生时录制前10s的页面上下文,用于分析错误发生原因
    • 录制用户在页面上的交互行为,分析交互路径,作为后续优化界面的数据支撑

视频

1 vlog #78|程序员下班后的学习记录|加班之后也要快乐学习鸭|远程办公带来的性格变化|Rust 智能合约学习中|《平面国》神作|英语学习|恢复分享欲ing

polebug233

这周一定要练八段锦!买了个瑜伽垫到现在还没用上😅,回到家立马打开瑜伽垫开始练习5min!

2 【现代前端开发必知10】惊了,用户体验还能这么做?

本期我们从 UI 设计、可访问性和个性化三个维度讨论用户体验还可以怎么做,相信你一定会有不少收获。

这一整个系列很推荐大家都看一遍,它能帮助你构建对前端开发所需知识和技能的整体认知框架。一旦你有了这个大框架,再进行学习时,就能清楚地知道自己在框架中的具体位置,从而更有针对性地进行学习。

3 挖掘真正的学习价值所在丨让编程再次伟大#20

视频回答以下问题:能不能通过学习好的代码来提高自己的编程水平?看好的开源仓库的源码真的有效果吗?怎么做才能提高自己的水平?

视频下有一个评论很好,在这里贴出来:

搞过项目的人都知道,维护老项目比自己搞新项目难度要高得多,做出来的成果还不被认可。原因是你花费了巨量时间去揣摩别人,而不是去关注业务,这很不值得。

工程项目业务是关键,架构设计的核心就是预判后续变更,让高频变更易开发,中频变更可扩展,低频变更影响可控。这些的关键是业务思考,你应该和人聊天而非闷头看代码。

学习需要简洁,而工程往往复杂。学牛顿力学我们讲的是理想模型,没有人用发动机拆开来讲 F=ma。工程代码杂糅了业务、性能甚至是政治博弈,老手都犯怵你新手不直接白给。

学语法学技巧就去看书上最简明的示例,想提高工程能力就去实践中踩坑历练。「调查问题就是解决问题」,你去踩了坑,自己就会找工具,工具能解决你的问题就是好工具,你就能建立自己的评价体系。

对于新人,最重要的是找一个自己感兴趣的事情做下去,你要把目标拆分,找出一个最小的产品,让自己先用起来或者有正向反馈,这样才能有动力接着去做。千里之行始于足下,是低头一步一步把路走出来的。这个过程你会遇到语法问题,API 问题,莫名其妙的 bug,你发现代码设计出问题了需要重构,你一点点的把这些问题解决了,不知不觉你就做起了一个项目。做一件事最好的时间就是当下,立即出发比啥都强。


文章

1 我用2万条真人AI海龟汤游戏数据,评估大模型推理能力哪家强

作者用海龟汤做benchmark测试模型的推理能力,原因有5:

  1. 不需要额外背景知识。 不同的大模型训练所使用的知识库不同,导致一些测评很难公正。但海龟汤游戏里几乎包含了推理所需的全部信息,一旦得知汤面和汤底,大模型就能作出判断,这使得评估被限定在了模型的推理能力。
  2. 结果是客观的,不以人类偏好为转移。 例如:在上述故事《山顶》里,小屋在悬崖边,主人半夜开门将登山者推下山导致后者被摔死。因此,门是朝外开的这个猜测就是正确的,这种正确性是客观的、和人的感受无关。
  3. 结果明确,很容易量化。 许多评估指标里,模型的输出结果是一段文本回答,这导致难以量化模型效果。但海龟汤的猜测结果只有三个:对、错、不相关。只要 准确标注了测试集,任何人就可以用它来测试任何自己想测试的模型,并获得量化的数值结果。
  4. 正常人类获知汤底的情况下,可以 100%答对。 这使得人工标注不会太过复杂。这条也说明,现阶段的大模型智商相比人类还有很大差距。
  5. 数据永远更新、无法作弊。 有部分厂商会直接将现有的 benchmark 数据集加入训练来刷分,但在海龟 Benchmark 这种模式下则行不通:模型评估的是用户的猜测,而不是故事本身。每隔一段时间,就会有玩家产生新的猜测,而人类的脑洞之大,导致猜测几乎无法被穷尽

测试结果是 Claude3.5、4o 和通义千问排前三(8月初的评估)

2 实操|基于抽象语法树(AST)的代码问题修复

这篇文章介绍了利用抽象语法树(AST)技术自动化解决前端代码中未使用变量或函数参数的问题。文章解释了AST的概念、结构和生成过程,并提出了一个基于AST的代码修复方案。该方案通过解析代码为AST、使用ESLint识别问题、遍历AST进行节点修改,最后将修改后的AST转换回代码,以自动化地修复问题。


播客

1 AI课代表丨为什么程序员都用AI写代码,不怕被抢了工作?

邀请到了通义灵码的产品技术负责人神秀和全面引进智能编码工具的趣丸科技研发效能负责人黄金作为嘉宾,聊一聊AI 编码到底发展到了什么阶段?为什么它依然是投资人最看好的三大场景之一?

我想不怕被抢工作的很重要的原因之一就是写代码只占工作时间的一半甚至更低,其余时间都在和其他同事battle🤣

2 AI课代表丨个人开发者碎瓜:为自己废寝忘食地工作,当然有大模型帮忙

很多朋友是因为“寻隐”(queryable)这款AI相册搜索应用认识碎瓜的,并深受启发,一些人还参考它的开源代码,做了边缘侧的部署。这其中也包括一些大公司。

尽管收获了hacker news榜首、copilot trending、应用上线15天用户突破40万等诸多成就,但碎瓜始终在过一种简单的创作者的生活。

这是他特别打动人的地方。他表明了一个人在技术浪潮中如何做到既全情投入又冷静旁观。

碎瓜的GitHub记录了他作为个人开发者的所思所想。如果这期节目听得不过瘾,推荐去读一读他的博客

「文章.1」介绍了碎瓜用海龟汤做 benchmark 测试模型推理能力的心路历程。

3 硬地骇客丨1024特辑:我们(公司)应该如何过好程序员节?

我们一起回顾技术论坛的黄金时代,也一起惋惜如今的现状。除了技术,我们还会聊聊程序员的那些事儿:代码事故、奇葩bug、以及剁手党程序员们的消费清单!更重要的是,我们将探讨如何让程序员节日更high,更有意义!


句子

1 远程办公之后,我的时间规划是怎么样的?

我的时间规划并不是以时间块为单位的,而是以任务为单位,对任务进行优先级排序

就比如说,我早上的任务按照优先级是: 1️⃣工作 2️⃣运动 3️⃣听 TED 4️⃣练习英语口语 5️⃣看书

如果今天工作不忙,早上有足够的时间(7:00 - 10:00),我就会先把 TED 和英语口语完成,然后做做运动,如果有时间的话再看一会杂书。

如果工作忙,这个任务的执行就会发生变化,先会完成运动和工作,然后根据时间安排英语的学习,比如 10-15 分钟快速听一篇 TED,简单练习 10 分钟口语,放弃看杂书的任务等等。

看了《福格行为模型》之后,我意识到,想要维持习惯的可持续性,需要能动态调整时间

当你有充足的时间和精力时,就增加习惯的难度和强度,当你很忙时,就需要让习惯变得容易完成

相比较于行为的时长,更重要的是保持这个行为的可持续,让它容易坚持下去

——polebug23