Skip to main content

8月4日内容汇总

· 10 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

模块化RAG:RAG新范式,像乐高一样搭建 万字长文

SmolLM: 一个超快速、超高性能的小模型集合

Gemini 1.5 Pro发布,赢了榜单第一,却被网友泼冷水

用近期火爆的Best-of-N策略加成变分推理Prompt,生成2024巴黎奥运会创意亮点介绍文章

【LLM开源模型】LLMs-Qwen2-240606通关攻略笔记v2.0

TRT-LLM中的Quantization GEMM(Ampere Mixed GEMM)CUTLASS 2.x 课程学习笔记

Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope

语义与效率、算法与算力双飞轮——小红书广告召回实践

豆包大模型视觉、语音能力升级!文生图更懂“国风”,TTS“拿捏”情绪

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

吴恩达弟子打造arXiv弹幕版,每篇论文都能自由讨论了!

Modelscope Agent实操(六):添加涂鸦作画能力到Modelscope-Agent中

大模型预训练开源数据集-整理

Llama3.1 中的Pipeline Parallelism技术Interleaved PP与WPipe的比较与扩展

以知识图谱结构为Prompt框架,帮LLM快速找出因果关系生成更精准内容

理解图结构和图推理,彻底掌握GraphRAG底层逻辑,悄悄超越99%的人 | ICLR2024

Meta「分割一切」进化2.0!一键跟踪运动物体,代码权重数据集全开源,网友:真正的OpenAI

ChatGPT版「Her」突然开放,第一波实测来了!用户已疯狂

失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三

🌟 SGLang技术分析

一文详解模型权重存储新格式 Safetensors

大道至简,GraphRAG生成的Prompt和数据集,用60行Python基础代码就能优化

亚马逊 RAG 新突破:REAPER 技术开启大型智能对话助手新境界

🌟 大模型时代的操作系统:融合Rust和大模型,vivo打造AI操作系统

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!

德黑兰、卡梅隆、哈佛等大学最新的C2P因果推理链Prompt,让LLM跨越因果推理鸿沟

Mistral系列模型核心技术详解

解锁开源模型高性能服务:SGLang Runtime 应用场景与实践

SGLang:LLM推理引擎发展新方向

用这条Q-Star的prompt让LLM拥有MDP,深思熟虑规划你的复杂推理

RAG 2.0谷歌RICHES:边检索、边思考、边生成

卡内基梅隆大学重磅,用这条Prompt让LLM递归内省,多轮交互中自我改进

GraphRAG+Ollama,构建本地精准全局问答系统!

TaD+RAG-缓解大模型“幻觉”的组合新疗法

大模型在推荐系统中的精准推荐策略与实践

探索大语言模型:理解Self Attention

⭐️ Go & 云原生 & Rust 相关

技术资讯
  • Sea-orm, diesel, sqlx 比较
  • 如何学习Rust的类型系统设计,自己写一个新语言
  • Rust开发经验总结
  • Jiff: 一个高层次的Rust时间库
  • query.rs - 搜索Rust的一切
    • 文档,crate,错误代码等等。 就是Rust生态的google
  • 使用Rust 10年后,我想吐槽几句。这篇文章分享了作者在使用Rust编程语言中的经验,特别是一些主要的痛点和问题。以下是总结:
    • 错误处理(Result<T, E>):
      • Rust的错误处理机制虽然强制开发者处理错误,但在实际使用中,尤其是库开发中,创建和转换错误类型非常麻烦。
      • 在应用代码中,通常只需要传播错误并向用户显示结果,但Rust缺乏Java那样的完善的错误日志和调用栈信息。
      • 作者建议Rust标准化一个类似于Box的类型,自动附加上下文信息,以便在函数间传播错误。
    • 模块系统:
      • Rust的模块系统过于灵活,容易导致意外暴露类型或模块。
      • 管理跨crate的代码组织困难,特别是在大型项目(如Bevy)的单一仓库中。
      • 作者认为Rust应更加显式,类似于Java的模块路径与文件系统文件夹对应的方式。
    • 编译时间和IDE工具:
      • 编译时间和IDE中的错误检查速度太慢,特别是对于大型项目(如Bevy)。
      • Rust的编译单元设计(1 crate = 1编译单元)导致每次修改都需要重新编译整个crate及其依赖项。
      • Rust分析器在大型项目中表现不佳,经常重新索引整个项目。
  • mistral.rs 比 llama.cpp 在大部的CUDA GPU上都快了。最新实现了 PagedAttention。
  • 写一个toy compiler。里面讲到了borrow checker的设计
  • 使用Rust构建搜索引擎。这篇访谈文章讲述了Meilisearch的联合创始人兼CTO Clément "Kero" Renault的经历。他从青少年时期开始编程,进入巴黎42学校,后在Veepee公司工作,参与改进搜索引擎。由于对性能的关注,他选择Rust语言自行开发搜索引擎,并在朋友的建议下创办了Meilisearch。

用Go语言构建优雅的事件驱动架构

Go 语言新征程:Russ Cox 告别,Austin Clements 开启新篇章

🌟 Go1.23 新特性:time.Reset 终于解决了过期时间值的坑!

Golang面试题:sysmon 有什么作用

Golang面试题:GMP 中 work stealing 机制

Traefik vs. NGINX

面向OpenTelemetry的Golang应用无侵入插桩技术

Go 团队负责人 Russ Cox 即将于 9 月 1 日卸任 TechLead,转战 AI 迭代 Oscar

从 v1 到 v2:分享我 WorkQueue 项目重构的完整思路

Go项目我不领导了,我去做AI了

Golang面试题:什么是 CAS

🌟 rust的web框架单机百万并发的性能与开销

Golang面试题:WaitGroup 实现原理

🌟 Go1.23 新特性:花了近 10 年,time.After 终于不泄漏了!

Go nil 的特殊行为:深入理解类型对比

🌟 字节开源 Go 内存引用分析工具,内存泄露一目了然!

🌟 Rust逆向入门:从反编译视角学习内存模型

一个全新的 Go pprof 视角 - 对象引用分析

🌟 Kubernetes 架构学习笔记(下)

Kubernetes 架构学习笔记(上)

Go 语言 Base64 编码解码实战指南

在 Go 中如何使用反射实现简易版 encoding/json

深入解析 Go 语言 GMP 模型:并发编程的核心机制

Go micro/cli 很不专业,居然直接删库了!

📒 后端相关

RocketMQ 为什么性能不如 Kafka

遇到面试官问微服务架构设计到底该如何回答

不服不行,这才是后端API接口应该有的样子!

1000W长连接,如何建立和维护?千万用户IM ,如何架构设计

ConcurrentHashMap 的 get 方法是否需要加锁

面试速记|图解MySQL执行一条SQL的过程

📒 前端相关

如何实现一个分词器

开发小程序又一新选择 vue-mini,据说性能是 Taro 的 10 倍,遥遥领先

技术周刊 | Bundler 近况、React 2023 状态报告出炉、小模型群雄并起、OpenAI 发布 SearchGPT