8月11日内容汇总 | Frontend Weekly

alt text

封面图：Safe by construction - Roberto Clapis

🌟 AI 相关

技术资讯

Transformer Explainer——文本生成模型的交互式学习
Transformer 可视化解释：通过互动可视化了解生成式 AI 中 Transformer 的工作原理
刚刚体验了一个超强的股票 API，里面囊括了所有 S&P 500 指数的股票数据。不仅如此，资产负债表、收入报表、现金流报表应有尽有，而且支持查询长达 30 年的数据！而且正式版更是会涵盖多达 15000 个股票数据
最近看到的最好的「多模态语言模型」讲解视频！🔥 6 小时手把手视频课程⚡️
- 每一步都有详细「图文并茂」解释
- 手把手写代码，了解多模态语言模型核心机制
- 教你实现一个「多模态语言模型」
We've released LangGraph v0.2 for increased customization with new checkpointer libraries
Building agents in an event-driven manner give users a lot more flexibility to build cyclic, multi-agent systems that have very complex communication patterns 🗣️👥
Nice survey paper on current practices and solutions for LLM-based agents for software engineering
这一个多月断断续续做 LobeChat 的文件上传/知识库，快把我做废了🥲 所幸快看到曙光了… 🥹
太酷啦！⚡️⚡️阿里发布了 Qwen2-Math，数学推理能力全球第一！！超越 GPT-4o 和 Claude-3.5-Sonnet🔥🔥
🚫 Claude 股票公式编写：标识不宜入场的路段。原理是基于真实波幅 (ATR) 的标准差，计算出属于低波动的范围，在相应的位置标识自定义符号。通过过滤垃圾波动，可以避免无谓的损失，同时提升资金利用率
Andrej Karpathy 关于 RLHF 的科普
如何构建生产级别的现代人工智能平台？即将出版《AI Engineer》的作者 @chipro 解释也太好了！🤯🔥
A nice short blog - "A minimal Introduction to Quantization"
Llama3.1 405b + Sonnet 3.5 for FREE with Google Cloud's $300 Free Credit
总结 Prompt 技术的优秀论文——提示词报告🔥🤯
- 58 种纯文本提示技术，包括零样本、少样本、思维生成、自我批评和分解技术。少样本 CoT 效果最好
- 提示工程：元提示、
- 答案工程：答案形状等
- 代理：工具使用、代码、RAG
- 安全性：Prompt 注入
- 对齐
Multi-Head RAG (MRAG), aims to improve retrieval accuracy for complex queries requiring that require fetching multiple documents with substantially different contents
OpenAI 支持 structured outputs 了，生成 JSON 格式的数据比原来更容易更准确了，我认为是对我非常有用的一个特性，因为太多开发者要生成更精准的 JSON 格式的数据做下一步处理
OpenAI just launched native support for constrained sampling to guarantee structured outputs
A Primer to Building Multi-agents as a Service 📖🤖
OpenAI 新模型 gpt-4o-2024-08-06 以及 gpt-4o-mini 支持结构化输出了，和以前的 JSON 模式不一样，现在的结构化输出不仅可以定义 JSON 的 Schema（也就是 JSON 输出的结构是什么样子），而且可以确保输出的 JSON 是 100% 正确的
Long awaited, but finally - Structured Outputs
Few Shot Prompting 🤝 LangSmith Datasets
DeepMind 的专家写了一篇 8 万字的文章介绍自己如何使用 AI
红杉整理了一个 2024 AI 50 榜单，有兴趣的小伙伴可以找到图里不熟悉的产品去把玩把玩，会有一些不错的收获的
瑞典皇家理工学院 @KTHuniversity 开源的「端到端机器学习」项目及课程资源与代码！⚡🤯
- 涵盖实时交通预测，股票情绪分析，海浪预测，航班延误分析等实用场景🔥
- 通过 Serverless ML 开发端到端项目，包括数据收集，特征工程，模型训练，部署推理及 Web 使用 UI 界面！
This blog by @pavan_mantha1 shows you how to build a local multi-agent system that relies on @RabbitMQ to broker communication between different agents (and uses @ollama + @qdrant_engine!)
Apple Intelligence 里面各种智能应用的提示词已经被曝光了，就作为 json 系统文件存在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目录下
这本 24.1K Star 的开源 LLM 教程/书籍也太好了！🤯
- 一边书籍已经被知名的 Manning 出版社出版，一边还在持续的跟进业界进展并加入到书籍中，最近又更新了如何《从 0 开始学习 LLM 对齐》的 DPO 课程！
- 现在就可以学习！😆
现在想想真不太真实😂 现在，@GoogleDeepMind Gemini Flash每百万 Token 只要 0.05 美金，@deepseek_ai 硬缓存输入每百万 Token 0.0.1 人民币 🤯 随着时间的推移，智能的成本降低了 100x，能力提升10x ⚡

最新研究：大语言模型使用Json格式输出会降低模型性能吗

太卷了，本周新鲜出炉的RAG论文都在这了

🌟 95% 向量资源节省，火山引擎云搜索 RAG 技术体系演进

LLaMA3.1为什么选择405B作为最大参数量

Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta下场反对

XetHub 加入 Hugging Face！

Qwen2-Math开源！初步探索数学合成数据生成！

没有等来Qwen2.5，但等来了Qwen2-Math

看完MindSearch源码，这就是我想要的Agent Plan！

Llama3训练每3小时崩一次？豆包大模型、港大团队为脆皮万卡训练提效

GLM大模型的机器翻译能力测试

从头预训练一只迷你 LLaMA 3

最高优化529倍！豆包大模型团队&港大提出ByteCheckpoint提效LLM训练

GPT-4o新版本突然上线：丝滑解决9.11和9.9谁大，更强也更便宜了

泄露！Apple Intelligence提示词原来是这样，还告诉大模型：别幻觉

大模型推理优化实践：KV cache复用与投机采样

特定领域的模型微调是否有意义？BioRAG，一个大型 RAG 实际应用案例告诉您

Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

AIGC大模型实践总结

多图、视频首上端！面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！魔搭推理、微调、部署实战教程来啦！

图解大模型计算加速系列：vLLM源码解析1，整体架构

SFT Packing数据拆分和4D mask详解

🌟 错误率从10%降至0.01%，领英全面分享LLM应用落地经验

LLM101n 硬核代码解读：Micrograd，一个轻量级的自动微分引擎

如何把 PyTorch 的 GPU 利用率提升到 100%

大模型微调到底有没有技术含量

量化方法怎么选？如何评估量化后的大模型LLM

如何用FP8训练大模型

Mem0唱罢，Memary登场！

🌟 CUDA性能简易优化（一）背景知识

一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO……

LLM可解释性的未来希望？稀疏自编码器是如何工作的，这里有一份直观说明

MindSearch技术详解，本地搭建媲美Perplexity的AI思·索应用！

【LLM数据工程】LLMs-开源数据-微调数据集总结v2.0

Meta与伯克利最新：元奖励Prompt，让LLM作为元法官能自我改进（包含Prompt模板）

⭐️ Go & 云原生 & Rust 相关

技术资讯

swiftide - RAG 工具链。使用Rust实现，Swiftide 是一个数据索引、处理和查询库，专为增强检索生成（RAG）设计。在构建大型语言模型（LLM）应用程序时，这些模型需要访问外部资源。数据需要被转换、丰富、拆分、嵌入和持久化。查询可以通过检索索引数据来增强并生成答案。它是用 Rust 构建的，使用并行、异步流，速度极快。
Rust与Python的交互。这是一个交互式的教程，一步一个练习，非常适合初学理解。
cargo-selector。Cargo 子命令用于选择和执行bin和example目标
WASM 和 Rust 从零实现 React v18: 实现 memo。这篇文章是《用 WASM 和 Rust 从头实现 React v18》系列的第22部分，重点介绍了如何实现 memo 功能。memo 是 React 中用于性能优化的功能，它可以防止不必要的组件重渲染。
A CLI tool that performs semantic searches on text input using word embeddings. It's designed to find semantically similar matches to the query, going beyond simple string matching
A small utility for configuring Go programs. It addresses three things the stdlib flag package makes a bit difficult
An interesting article "Go structs are copied on assignment (and other things about Go I'd missed)"
Learn how to use Go and the Gin framework to create reusable HTML templates and simplify your code structure. Explore the solution here!
Learn how to use Rust workspaces to organize and reuse your code more effectively. This guide covers practical steps plus a REST API example
Learn to build efficient Docker images for Golang apps, compare base images, uncover security considerations, and decide what suits your project best
A Go library for processing various content types into markdown/plaintext
#Docker Images for Go (Golang) Small, Faster #Docker Images and #Security
Learn how to control and customize your Rust tests with cargo test. Navigate parallel tests, test output, and more command-line options easily
Go errors.Is now (with Go 1.23+) includes a nil check
A flexible and powerful SQL string builder Go library plus a zero-config ORM
Dive into using Rust with AWS Lambda, OpenTelemetry, and Datadog for better serverless observability and seamless telemetry setup in your projects
Reduce allocations and comparison performance with the new unique package in Go 1.23
Discover the Dark Side of Go: Why This Popular Language May Sucks
Let's master decentralized app building with a helping hand from Stellar smart contracts! We'll tackle development setup, user authentication, minting tokens, deposits, and more!

从源代码中窥探 Go 的 WaitGroup 实现和应用

Golang 中对时间控制的方法和技巧

Golang面试题： Go 性能说明

利用go trace优化垃圾回收

Kubernetes 中的 Sidecar 模式：Go 语言实战指南

没有什么不可能：修改 Go 结构体的私有字段

Golang面试题：常量 const

Rust 迭代器并非速度致胜

go-sqlbuilder：灵活强大的Go语言SQL语句构建库，兼具零配置ORM功能

Go 1.22.6 和 Go 1.21.13 刚刚发布，未包含 security fix

Go1.23 新特性：slices、panic、cookie 等函数改进，效率提高了！

Go的GMP模型真的“简单”

Golang面试题：GC 触发时机

🌟 Golang 并发的 fork/join 模式

go-chi：用于构建 Go HTTP 服务的轻量级且可组合的路由器

学习 Kubernetes 源码的过程中，我沉淀的笔记方法

Golang面试题：Redis 的回收策略(淘汰策略)

深入探究 K8S Pod 安全策略与准入控制器：构建坚不可摧的容器安全防线

K8S 配置魔法：ConfigMap & Secret 的神秘世界

深入解析 Kubernetes RBAC：保障集群安全与权限管理的利器

在 K8S 中部署高可用 Redis 集群

深入解析 K8S 原理及各组件的神秘面纱

使用TLA+形式化验证Go并发程序

通过写 Kubernetes 专栏，我不断在进化

Golang面试题：写屏障

📒 后端相关

微服务架构拆分的 7 大黄金法则

想要支持百万长连接，需要调优哪些参数

手把手教你用程序 Debug TCP连接的断开流程

什么是数据库的逻辑删除？数据库的物理删除和逻辑删除有什么区别

从0到1大实战：穿透 SpringCloud 工业级底座工程，15大圣经，实力瞬间爆表

一套万能的异步处理方案！

📒 前端相关

小红书的pc端瀑布流的效果是怎么实现的

🌟 AI 相关​

⭐️ Go & 云原生 & Rust 相关​

📒 后端相关​

📒 前端相关​

🌟 AI 相关

⭐️ Go & 云原生 & Rust 相关

📒 后端相关

📒 前端相关