⭐️ 每周更新优质技术文章,欢迎点赞关注!
9月8日内容汇总
封面图:Go 1.23 刚刚发布了第一个补丁,包括多个安全问题,涉及 go/parser, encoding/gob...
🌟 AI 相关
关于如何做科研的一些个人经验 -- 清华AP、Mooncake作者
黑神话悟空火了,为何没人用H100打游戏?(盘点H100和4090的十点区别)
亚马逊最新发布的PR3框架,用元知识大幅提升LLM对知识库的回答质量
小钢炮进化,MiniCPM 3.0 开源!4B参数超GPT3.5性能,无限长文本,超强RAG三件套!模型推理、微调实战来啦!
【LLM模型幻觉】LLMs-模型幻觉-腾讯LLM幻觉综述-20230924v3.0
小模型杀疯了!仅4B参数性能超GPT-3.5!无限长文本性能超Kimi
4B小模型掀翻大模型牌桌!性能超GPT-3.5,无限长文本性能超Kimi...
重磅惊雷,用结构化RAG约束JSON响应格式化,复合AI系统输出成功率高达82.55%
微软等EfficientRAG:迭代分解Query提升多跳问答效果!
MemLong: 长文本的新记忆大师,可将上下文长度从4k提升到80k!
【LLM模型微调】LLMs-微调综述-CCG微调终极指南v8.0
斯坦福和UC伯克利TAG之前发布的LOTUS,用LLMs改写AI时代的数据查询引擎
LAVE: 使用 LLM 对 Docmatix 进行零样本 VQA 评估 - 我们还需要微调吗
RAG 升级版-MemLong: 基于记忆增强检索的长文本建模方法
Tool-SQL:基于Agent智能体的Text2SQL解决方案,显著提升Text2SQL效果
UC伯克利和斯坦福最新TAG,结构化数据增强生成,别让Text2SQL和RAG缚住手脚
SGLang Runtime + Qwen2-7B!解锁开源模型高性能服务
🌟 ACL2024 | LLM+RAG可能要毁了信息检索,一份深入研究
🌟 千问团队tech lead解读Qwen2-VL:让我们先把视觉理解干上去!(一)
⭐️ Go & 云原生 & Rust 相关
使用 niljson 处理 Go 语言中 JSON 的空值类型
Go 1.23 刚刚发布了第一个补丁,包括多个安全问题,涉及 go/parser, encoding/gob...
Go必知必会:Go并发编程详解,锁、WaitGroup、Channel
K8s v1.31:全新的 CPUManager 静态策略:跨核分发 CPU
🌟 go、toolchain directive、gotoolchain和gotoolchain环境变量,就问你晕不晕
Golang - 使用 GoFakeIt 生成 Mock 数据
Go必知必会:深入解析 Go 语言 GMP 模型和并发编程的核心机制
📒 后端相关
ByteHouse案例实践:某销售数据平台如何基于OLAP大幅提升复杂查询效率
📒 前端相关
9月1日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
🌟 LRP4RAG、RAGLAB、PermitQA、LegalBench-RAG:本周10余篇论文讨论RAG,有兴趣的可以看看
AgentMove、DrugAgent、AppAgent:本周智能体应用相关论文
Meta-Knowledge RAG:显著提升传统RAG的6大性能指标
Concise Thoughts:仅通过长度限制,获取更简明的CoT能大幅度提升效果
【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0
大模型摘要的姿势,prompt chain还是stepwise
🌟 Qwen2-VL发布,支持复杂推理与决策的可视化Agent!
🌟 Qwen2-VL 全链路模型体验、下载、推理、微调实战!
贾扬清点赞,马斯克XAI发贺电:SGLang v0.2推理Llama 3.1 405B秒杀vLLM、TensorRT-LLM
斯坦福、伯克利大学新思路:TAG,结合了Text2SQL和RAG的新设计范式,效果更好、速度更快
🌟 Agents时代的Workflow,用AgWf重塑流程挖掘,CrewAI实现
Flux第四弹-秒级生图,字节开源Hyper-sd支持Flux,支持多LoRA叠加!
8岁女孩玩转AI编程,45分钟打造聊天机器人,Karpathy都看呆了
从Think-on-Graph(ToG)到ToG 2.0:用知识图谱Prompt让LLM实现深度推理,ICLR2024
又见惊雷,结构化Prompt格式小小变化竟能让LLM性能波动高达76%,ICLR2024
⭐️ Go & 云原生 & Rust 相关
Go 1.23 新特性:slices 和 sync 等核心库的微调,大幅提升开发体验
Rust 错误处理:thiserror vs. anyhow
128核CPU就有罪了?channel并发变慢的锅CPU可背不起
IEEE Spectrum 2024排行榜:Rust和TypeScript崛起,Go语言表现如何
📒 后端相关
使用 SpanMetrics Connector 将 OpenTelemetry 跟踪转换为指标
📒 前端相关
8月25日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
TC-RAG: Turing-Complete RAG--图灵完备的检索增强
🌟 Weavel Ape超过DSPy,或将成为最好用的提示(prompt)优化工具
Karpathy狂赞AI代码神器Cursor,直言回不到3年前无辅助编码了,却被指「带货」
如何解读 Yann LeCun推文建议学生不要在大模型方向工作
RAGLAB、TC-RAG、CommunityKG-RAG、W-RAG:这周怎么这么多RAG
【LLM模型微调】LLMs-PEFT[微调]-LoRA总结笔记v5.0
FLUX第三弹:直面天命,FLUX.1-LoRA/IP-adapter「黑神话:悟空」生图实战
微软「小而美」系列三连发!视觉小钢炮 PK GPT-4o,MoE 新秀力压 Llama 3.1|AGI 掘金资讯
豆包“听力”水平现场开箱!看Seed-ASR如何突破语音识别瓶颈
英伟达仅用380B tokens训练刷新8B模型新SoTA,剪枝和蒸馏应该这么用
社区供稿 | 使用 Hugging Face 和 Milvus 构建 RAG 系统
Plan-based Retrieval,告别AI的胡言乱语
Ilya Sutskever 预测:GPT-5 之后,AGI 将降临
一文看懂GraphRAG:蚂蚁集团联合各所名校出品GraphRAG综述
不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token
多图理解,更懂中文,支持function call的Phi-3.5来了!
谢谢微软,又又又Open了!一口气发布3款Phi-3.5新模型,领先Llama3.1和谷歌同级模型
1000个样本胜过百万数据?Meta AI最新研究引发行业震动
🌟 RAG 检索大升级:BM25 与 RRF 助力 LLMs 精准破局
使用 Dify 和 AI 大模型理解视频内容:Qwen 2 VL 72B
Multi-Meta-RAG:langchain点名,评论爆吹的新研究
AgentWrite:为什么你的模型生成的内容长度总是不超过2K
🌟 RAG 进阶:一个 ctrl-c 就能拿走的图文检索框架
工业界Agentic RAG方案-Golden-Retriever
WeKnow-RAG:结合网络搜索和知识图谱的自适应检索增强生成方法
阿里开源通用多模态大模型mPLUG-Owl3:迈向多图长序列理解
⭐️ Go & 云原生 & Rust 相关
- QUIC协议的一些基操解释
- Rust实现的一个狭义相对论模拟
- Rust中的Mutex, Atomics 和 UnsafeCell。这篇文章主要讨论了Rust中的Mutex、Atomics和UnsafeCell的实现原理和相关概念:
- 文章通过自定义实现AtomicUsize来探讨原子操作的原理。作者发现简单使用UnsafeCell并不能实现真正的原子性,因为编译器会对其进行优化。
- 真正的原子操作需要使用编译器内部函数(intrinsics)来实现,这些函数不仅生成原子指令,还会告诉编译器不要对其进行优化。
- Mutex的实现基于UnsafeCell和一个原子整数。获取锁时使用原子的compare_exchange操作,释放锁时使用原子操作配合内存顺序(memory ordering)来保证可见性。
- 内存顺序(如Acquire和Release)不仅影响生成的机器指令,还会限制编译器的优化,从而保证跨线程的内存访问顺序。
- VolatileCell用于嵌入式系统中访问内存映射I/O。它使用volatile读写操作,但仍存在一些安全性问题。
- volatile操作与原子操作不同,不能建立happens-before关系。对于DMA等操作,需要额外使用内存屏障(fence)来保证顺序。
- 文章深入探讨了UnsafeCell、原子操作、内存顺序等概念如何在底层影响Rust的并发安全性,对理解Rust的并发模型很有帮助。
Go1.23 新特性:再开后门,可以记录未捕获的 panic 和 throw 日志了!
🌟 Kitex Thrift Streaming 在字节跳动 Prompt 平台的实践
一款支持自动流水线和客户端缓存的 Go 语言 Redis 客户端
了解 Golang 中的内存管理:Stack vs Heap
📒 后端相关
一线实战:运维人少,我们是如何从 0 到 1 实践 DevOps 和云原生
📒 前端相关
8月18日内容汇总
封面图:Russ Cox 领导 Go 团队发布的最后一个版本 Go 1.23.0 终于发布啦!来的比以往晚了几天!
🌟 AI 相关
HybridRAG: 融合知识图谱和向量检索的新型信息提取方法
【LLM模型微调】LLMs-数据构造-LIMA-230518论文总结v3.0
LLM的幻觉怎么分类,有哪些缓解幻觉的技术,这里是你应该知道的前沿调查
英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强
腾讯优图开源多模态大模型VITA : GPT-4o的简易平替!
一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企「炒作」AgentQ
【LLM模型微调】LLMs-PEFT[微调]-微调经验总结v1.0
OpenAI「草莓」提前曝光?ChatGPT 版搜索引擎惊现神秘模型|AGI 掘金资讯
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
RAG Foundry:开源RAG框架,数据、推理、测评一条龙
【LLM数据工程】LLMs-数据构造-Self-Instruct总结v3.0
AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图
TGI 多-LoRA: 部署一次,搞定 30 个模型的推理服务
⭐️ Go & 云原生 & Rust 相关
Go1.23 新特性:新库 structs.HostLayout,终于可以指定内存布局了!
Kubernetes v1.31 正式发布:欢庆十周年,迎接新纪元
Go 1.23 正式发布:性能提升、Telemetry 加入和标准库改进
Russ Cox 领导 Go 团队发布的最后一个版本 Go 1.23.0 终于发布啦!来的比以往晚了几天!
基于 Golang 和 Redis 解决分布式系统下的并发问题
夜天之书 #102 从参与 Rust 标准库开发看开源贡献的源动力
Go1.23 新特性:试图禁用 //go:linkname,建立新的握手机制!
📒 后端相关
📒 前端相关
8月11日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
- Transformer Explainer——文本生成模型的交互式学习
- Transformer 可视化解释:通过互动可视化了解生成式 AI 中 Transformer 的工作原理
- 刚刚体验了一个超强的股票 API,里面囊括了所有 S&P 500 指数的股票数据。不仅如此,资产负债表、收入报表、现金流报表应有尽有,而且支持查询长达 30 年的数据!而且正式版更是会涵盖多达 15000 个股票数据
- 最近看到的最好的「多模态语言模型」讲解视频!🔥 6 小时手把手视频课程⚡️
- 每一步都有详细「图文并茂」解释
- 手把手写代码,了解多模态语言模型核心机制
- 教你实现一个「多模态语言模型」
- We've released LangGraph v0.2 for increased customization with new checkpointer libraries
- Building agents in an event-driven manner give users a lot more flexibility to build cyclic, multi-agent systems that have very complex communication patterns 🗣️👥
- Nice survey paper on current practices and solutions for LLM-based agents for software engineering
- 这一个多月断断续续做 LobeChat 的文件上传/知识库,快把我做废了🥲 所幸快看到曙光了… 🥹
- 太酷啦!⚡️⚡️阿里发布了 Qwen2-Math,数学推理能力全球第一!!超越 GPT-4o 和 Claude-3.5-Sonnet🔥🔥
- 🚫 Claude 股票公式编写:标识不宜入场的路段。原理是基于真实波幅 (ATR) 的标准差,计算出属于低波动的范围,在相应的位置标识自定义符号。通过过滤垃圾波动,可以避免无谓的损失,同时提升资金利用率
- Andrej Karpathy 关于 RLHF 的科普
- 如何构建生产级别的现代人工智能平台?即将出版《AI Engineer》的作者 @chipro 解释也太好了!🤯🔥
- A nice short blog - "A minimal Introduction to Quantization"
- Llama3.1 405b + Sonnet 3.5 for FREE with Google Cloud's $300 Free Credit
- 总结 Prompt 技术的优秀论文——提示词报告🔥🤯
- 58 种纯文本提示技术,包括零样本、少样本、思维生成、自我批评和分解技术。少样本 CoT 效果最好
- 提示工程:元提示、
- 答案工程:答案形状等
- 代理:工具使用、代码、RAG
- 安全性:Prompt 注入
- 对齐
- Multi-Head RAG (MRAG), aims to improve retrieval accuracy for complex queries requiring that require fetching multiple documents with substantially different contents
- OpenAI 支持 structured outputs 了,生成 JSON 格式的数据比原来更容易更准确了,我认为是对我非常有用的一个特性,因为太多开发者要生成更精准的 JSON 格式的数据做下一步处理
- OpenAI just launched native support for constrained sampling to guarantee structured outputs
- A Primer to Building Multi-agents as a Service 📖🤖
- OpenAI 新模型 gpt-4o-2024-08-06 以及 gpt-4o-mini 支持结构化输出了,和以前的 JSON 模式不一样,现在的结构化输出不仅可以定义 JSON 的 Schema(也就是 JSON 输出的结构是什么样子),而且可以确保输出的 JSON 是 100% 正确的
- Long awaited, but finally - Structured Outputs
- Few Shot Prompting 🤝 LangSmith Datasets
- DeepMind 的专家写了一篇 8 万字的文章介绍自己如何使用 AI
- 红杉整理了一个 2024 AI 50 榜单,有兴趣的小伙伴可以找到图里不熟悉的产品去把玩把玩,会有一些不错的收获的
- 瑞典皇家理工学院 @KTHuniversity 开源的 「端到端机器学习」项目及课程资源与代码!⚡🤯
- 涵盖实时交通预测,股票情绪分析,海浪预测,航班延误分析等实用场景🔥
- 通过 Serverless ML 开发端到端项目,包括数据收集,特征工程,模型训练,部署推理及 Web 使用 UI 界面!
- This blog by @pavan_mantha1 shows you how to build a local multi-agent system that relies on @RabbitMQ to broker communication between different agents (and uses @ollama + @qdrant_engine!)
- Apple Intelligence 里面各种智能应用的提示词已经被曝光了,就作为 json 系统文件存在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目录下
- 这本 24.1K Star 的开源 LLM 教程/书籍也太好了!🤯
- 一边书籍已经被知名的 Manning 出版社出版,一边还在持续的跟进业界进展并加入到书籍中,最近又更新了如何《从 0 开始学习 LLM 对齐》的 DPO 课程!
- 现在就可以学习!😆
- 现在想想真不太真实😂 现在,@GoogleDeepMind Gemini Flash每百万 Token 只要 0.05 美金,@deepseek_ai 硬缓存输入每百万 Token 0.0.1 人民币 🤯 随着时间的推移,智能的成本降低了 100x,能力提升10x ⚡
🌟 95% 向量资源节省,火山引擎云搜索 RAG 技术体系演进
Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对
看完MindSearch源码,这就是我想要的Agent Plan!
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
最高优化529倍!豆包大模型团队&港大提出ByteCheckpoint提效LLM训练
GPT-4o新版本突然上线:丝滑解决9.11和9.9谁大,更强也更便宜了
泄露!Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉
特定领域的模型微调是否有意义?BioRAG,一个大型 RAG 实际应用案例告诉您
Agentic RAG Golden-Retriever:显著提升企业知识库问答准确性、检索效率!
多图、视频首上端!面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!魔搭推理、微调、部署实战教程来啦!
🌟 错误率从10%降至0.01%,领英全面分享LLM应用落地经验
LLM101n 硬核代码解读:Micrograd,一个轻量级的自动微分引擎
一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……
LLM可解释性的未来希望?稀疏自编码器是如何工作的,这里有一份直观说明
MindSearch技术详解,本地搭建媲美Perplexity的AI思·索应用!
【LLM数据工程】LLMs-开源数据-微调数据集总结v2.0
Meta与伯克利最新:元奖励Prompt,让LLM作为元法官能自我改进(包含Prompt模板)
⭐️ Go & 云原生 & Rust 相关
- swiftide - RAG 工具链。使用Rust实现,Swiftide 是一个数据索引、处理和查询库,专为增强检索生成(RAG)设计。在构建大型语言模型(LLM)应用程序时,这些模型需要访问外部资源。数据需要被转换、丰富、拆分、嵌入和持久化。查询可以通过检索索引数据来增强并生成答案。它是用 Rust 构建的,使用并行、异步流,速度极快。
- Rust与Python的交互。这是一个交互式的教程,一步一个练习,非常适合初学理解。
- cargo-selector。Cargo 子命令用于选择和执行bin和example目标
- WASM 和 Rust 从零实现 React v18: 实现 memo。这篇文章是《用 WASM 和 Rust 从头实现 React v18》系列的第22部分,重点介绍了如何实现 memo 功能。memo 是 React 中用于性能优化的功能,它可以防止不必要的组件重渲染。
- A CLI tool that performs semantic searches on text input using word embeddings. It's designed to find semantically similar matches to the query, going beyond simple string matching
- A small utility for configuring Go programs. It addresses three things the stdlib flag package makes a bit difficult
- An interesting article "Go structs are copied on assignment (and other things about Go I'd missed)"
- Learn how to use Go and the Gin framework to create reusable HTML templates and simplify your code structure. Explore the solution here!
- Learn how to use Rust workspaces to organize and reuse your code more effectively. This guide covers practical steps plus a REST API example
- Learn to build efficient Docker images for Golang apps, compare base images, uncover security considerations, and decide what suits your project best
- A Go library for processing various content types into markdown/plaintext
- #Docker Images for Go (Golang) Small, Faster #Docker Images and #Security
- Learn how to control and customize your Rust tests with
cargo test
. Navigate parallel tests, test output, and more command-line options easily - Go errors.Is now (with Go 1.23+) includes a nil check
- A flexible and powerful SQL string builder Go library plus a zero-config ORM
- Dive into using Rust with AWS Lambda, OpenTelemetry, and Datadog for better serverless observability and seamless telemetry setup in your projects
- Reduce allocations and comparison performance with the new unique package in Go 1.23
- Discover the Dark Side of Go: Why This Popular Language May Sucks
- Let's master decentralized app building with a helping hand from Stellar smart contracts! We'll tackle development setup, user authentication, minting tokens, deposits, and more!
Kubernetes 中的 Sidecar 模式:Go 语言实战指南
go-sqlbuilder:灵活强大的Go语言SQL语句构建库,兼具零配置ORM功能
Go 1.22.6 和 Go 1.21.13 刚刚发布,未包含 security fix
Go1.23 新特性:slices、panic、cookie 等函数改进,效率提高了!
go-chi:用于构建 Go HTTP 服务的轻量级且可组合的路由器
深入探究 K8S Pod 安全策略与准入控制器:构建坚不可摧的容器安全防线
K8S 配置魔法:ConfigMap & Secret 的神秘世界
深入解析 Kubernetes RBAC:保障集群安全与权限管理的利器
📒 后端相关
什么是数据库的逻辑删除?数据库的物理删除和逻辑删除有什么区别
从0到1大实战:穿透 SpringCloud 工业级 底座工程,15大圣经,实力瞬间爆表
📒 前端相关
8月4日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
Gemini 1.5 Pro发布,赢了榜单第一,却被网友泼冷水
用近期火爆的Best-of-N策略加成变分推理Prompt,生成2024巴黎奥运会创意亮点介绍文章
【LLM开源模型】LLMs-Qwen2-240606通关攻略笔记v2.0
TRT-LLM中的Quantization GEMM(Ampere Mixed GEMM)CUTLASS 2.x 课程学习笔记
Google 最新发布: Gemma 2 2B、ShieldGemma 和 Gemma Scope
豆包大模型视觉、语音能力升级!文生图更懂“国风”,TTS“拿捏”情绪
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快
Modelscope Agent实操(六):添加涂鸦作画能力到Modelscope-Agent中
Llama3.1 中的Pipeline Parallelism技术Interleaved PP与WPipe的比较与扩展
以知识图谱结构为Prompt框架,帮LLM快速找出因果关系生成更精准内容
理解图结构和图推理,彻底掌握GraphRAG底层逻辑,悄悄超越99%的人 | ICLR2024
Meta「分割一切」进化2.0!一键跟踪运动物体,代码权重数据集全开源,网友:真正的OpenAI
ChatGPT版「Her」突然开放,第一波实测来了!用户已疯狂
失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三
大道至简,GraphRAG生成的Prompt和数据集,用60行Python基础代码就能优化
亚马逊 RAG 新突破:REAPER 技术开启大型智能对话助手新境界
🌟 大模型时代的操作系统:融合Rust和大模型,vivo打造AI操作系统
别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了
重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!
德黑兰、卡梅隆、哈佛等大学最新的C2P因果推理链Prompt,让LLM跨越因果推理鸿沟
解锁开源模型高性能服务:SGLang Runtime 应用场景与实践
用这条Q-Star的prompt让LLM拥有MDP,深思熟虑规划你的复杂推理
卡内基梅隆大学重磅,用这条Prompt让LLM递归内省,多轮交互中自我改进
⭐️ Go & 云原生 & Rust 相关
- Sea-orm, diesel, sqlx 比较
- 如何学习Rust的类型系统设计,自己写一个新语言
- Rust开发经验总结
- Jiff: 一个高层次的Rust时间库
- query.rs - 搜索Rust的一切
- 文档,crate,错误代码等等。 就是Rust生态的google
- 使用Rust 10年后,我想吐槽几句。这篇文章分享了作者在使用Rust编程语言中的经验,特别是一些主要的痛点和问题。以下是总结:
- 错误处理(
Result<T, E>
):- Rust的错误处理机制虽然强制开发者处理错误,但在实际使用中,尤其是库开发中,创建和转换错误类型非常麻烦。
- 在应用代码中,通常只需要传播错误并向用户显示结果,但Rust缺乏Java那样的完善的错误日志和调用栈信息。
- 作者建议Rust标准化一个类似于Box的类型,自动附加上下文信息,以便在函数间传播错误。
- 模块系统:
- Rust的模块系统过于灵活,容易导致意外暴露类型或模块。
- 管理跨crate的代码组织困难,特别是在大型项目(如Bevy)的单一仓库中。
- 作者认为Rust应更加显式,类似于Java的模块路径与文件系统文件夹对应的方式。
- 编译时间和IDE工具:
- 编译时间和IDE中的错误检查速度太慢,特别是对于大型项目(如Bevy)。
- Rust的编译单元设计(1 crate = 1编译单元)导致每次修改都需要重新编译整个crate及其依赖项。
- Rust分析器在大型项目中表现不佳,经常重新索引整个项目。
- 错误处理(
- mistral.rs 比 llama.cpp 在大部的CUDA GPU上都快了。最新实现了 PagedAttention。
- 写一个toy compiler。里面讲到了borrow checker的设计
- 使用Rust构建搜索引擎。这篇访谈文章讲述了Meilisearch的联合创始人兼CTO Clément "Kero" Renault的经历。他从青少年时期开始编程,进入巴黎42学校,后在Veepee公司工作,参与改进搜索引擎。由于对性能的关注,他选择Rust语言自行开发搜索引擎,并在朋友的建议下创办了Meilisearch。
Go 语言新征程:Russ Cox 告别,Austin Clements 开启新篇章
🌟 Go1.23 新特性:time.Reset 终于解决了过期时间值的坑!
Golang面试题:GMP 中 work stealing 机制
面向OpenTelemetry的Golang应用无侵入插桩技术
Go 团队负责人 Russ Cox 即将于 9 月 1 日卸任 TechLead,转战 AI 迭代 Oscar
从 v1 到 v2:分享我 WorkQueue 项目重构的完整思路
🌟 Go1.23 新特性:花了近 10 年,time.After 终于不泄漏了!
在 Go 中如何使用反射实现简易版 encoding/json
📒 后端相关
1000W长连接,如何建立和维护?千万用户IM ,如何架构设计
ConcurrentHashMap 的 get 方法是否需要加锁
📒 前端相关
开发小程序又一新选择 vue-mini,据说性能是 Taro 的 10 倍,遥遥领先
技术周刊 | Bundler 近况、React 2023 状态报告出炉、小模型群雄并起、OpenAI 发布 SearchGPT
7月28日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
- Building A Generative AI Platform
- OpenAI计划推出一个AI搜索引擎项目SearchGPT
- The quality of hosted Llama 3.1 may vary by provider
- 构建生成式 AI 平台
- 最多 128 个 Function!DeepSeek 版本 Function Calling 终于来了!🔥
- Andrej 为了解释 Word 和 Token 的区别,写了个小程序,把 Token 用 Emoji 表示,好帮助你直观的理解 LLM (大语言模型)看到的世界和我们看到的世界是不一样的
- Coding with Llama 3.1, new DeepSeek Coder & Mistral Large - From aider leaderboards
- 今天跟 LLM 前沿的研究员聊了一下午,收获了很多有趣的 insights,先分享一个,后续慢慢整理
- Very interesting study on comparing RAG and long-context LLMs
- Meta为Llama 3.1构建的一个智能体任务系统:Llama Agentic System
- Nice overview of KV-Cache compression methods
- 实现使用超低价格、在领域微调能力达到最强智能且规模解决实际问题?🤔
- Llama 3.1 Paper is incredible to read. This part is on their method of filtering out bad samples
- lama-3.1 is now supported by WebLLM and up on WebLLM Chat 👨🔧
- 又一个 Cuda 挑战者!新 GPU 编程范式来了?🔥 前 Google DeepMind 大牛基于 WebGPU 开源了一个使用 C++ 操作 GPU 的库 - gpu.cpp,短时间暴涨 1.1K Star ⭐️
- Rule-based rewards (RBRs) use model to provide RL signals based on a set of safety rubrics, making it easier to adapt to changing safety policies wo/ heavy dependency on human data. It also enables us to look at safety and capability in a more unified lens as a more capable grader model gives us higher quality RL signals
- 让老师爽翻的10个话术
- OpenAI的gpt4o-mini 支持微调了,而且有免费额度。这里有个gpt的微调范例可以参照
- Cloudflare全栈工具包:前后端全部基于Cloudflare,适合免费、快速搭建网页应用,作者基于这套工具包搭建了应用
- Mistral Large 2, a 123 billion parameter model with a 128k context window 🤯
- 一个使用 Llama 3.1 模型构建 RAG 应用的示例
从零到一使用 Ollama、Dify 和 Docker 构建 Llama 3.1 模型服务
OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略
小模型狂飙!6家巨头争相发布小模型,Andrej Karpathy:大语言模型的尺寸竞争正在倒退...
SearchGPT第一波评测来了!响应速度超快还没广告,“OpenAI杀手锏”
LLM101n 硬核代码解读:手把手教你用PyTorch实现多层感知机MLP
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
图解Attention优化: 从Online-Softmax到FlashAttention V1/V2/V3
微软最新,让Prompt进化自动化,用Auto EvolInstruct来拯救你的结构化提示词
🌟 不止llama 3.1!Meta还同步开源了安全审核和提示词注入、越狱校验的2个新模型
🌟 Meta开源的Llama官方Agent:Llama-Agentic-System深度解析
Large Enough!Mistral Large 2开源!魔搭推理、微调最佳实战教程来啦!
打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制,一口气解答8大问题
ICML最佳论文曾被ICLR拒稿,Pika联创参与,一作已入职OpenAI
重磅!Mistral Large 2深夜发布!Llama3.1仅一天被超越,最强开源再易主
Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析
llama 3.1终于开源!速览技术报告中最有意思的17个新要点
Meet Llama3.1,405B赶超最强闭源模型!上魔搭社区一站体验、下载、推理、微调、部署
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅
🌟 2024年推荐系统技术全面综述:历史、现状、分类、应用、展望
Llama3.1系列模型正式开源,最大405B,闭源模型的统治时代将迎来结束
使用InternVL、LMDeploy和GTE搭建多模态RAG系统
QOQA:利用TopK文档进行查询改写,平均提升RAG 1.6% 准确率
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星
苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
⭐️ Go & 云原生 & Rust 相关
- model-mapper: 这个库提供了一个宏,用于实现在不产生模板代码的情况下在各种类型(包括枚举和结构体)之间进行转换的函数
- EmbedAnything: 一种极简但高性能、轻量级、多源、多模态和本地嵌入解决方案,内置 Rust
- cake - 分布式推理引擎
- monitor - Rust实现的编排和部署工具
- [rust is best]10 亿行挑战方案。作者尝试优化 Rust 中「10 亿行挑战」的解决方案。从原始的 5 分钟优化到了 9 秒。作者的主要目标是创建一段简单、可维护且生产就绪的代码,而且没有使用不安全的操作。以下是一些关键经验:
- 使用
--release
优化构建 - 避免在关键路径中使用
println!
;使用日志库进行调试 - 谨慎使用
FromIterator::collect()
;它会触发新的分配 - 最小化不必要的分配,特别是避免使用
to_owned()
和clone()
- 更换哈希函数,
FxHashMap
比标准的HashMap
稍微更快 - 对于大文件,优先使用缓冲读取而不是加载整个文件
- 当不需要 UTF-8 验证时,使用字节片段(
[u8]
)而不是字符串 - 只有在优化单线程性能后才进行并行化
- 使用
- Learn a new way to enhance error handling in your Rust projects with program flow tracing using macros and the
anyhow
crate. Check out this detailed guide! - Discover how GoFr accelerates microservice development with seamless config management, Pub/Sub support, and integrated auth in your Go projects
- Learn how to accept Bitcoin payments using Python, Rust, and the PyO3 library. Build and test a non-trivial extension module from scratch
- Discover the key to mastering Rust: lifetimes. This article dives into their importance, usage, and practical examples to ensure memory safety in your code
- How to Build Your Own Distributed KV Storage System Using the etcd Raft Library (2)
threadsafe:使用Golang实现线程安全的数据结构
[小布去面试]Tricky 的 Golang 面试题 - interface = nil
LazyCell 和 LazyLock: Rust 1.80.0 新同步原语
Go1.23 新特性:新标准库 unique,性能更好,开销更小!
揭秘 Golang 的异常处理利器: Panic 与 Recover 的深度探索
🌟 Go-Zero 数据库实战:配置、建模与业务逻辑一体化(八)
Genkit - Google 推出 Genkit for Go, 用于以 Go 语言构建 AI 应用
Go 发布 AI 机器人 Oscar,解决开源项目的维护痛点!
📒 后端相关
📒 前端相关
7月21日内容汇总
封面图:Go 1.23 Release Candidate 2 is released!
🌟 AI 相关
- GPT-4o mini: advancing cost-efficient intelligence
- 获 OpenAI 370 万美金投资,「连接你生活点滴」的爆火的 AI 应用⚡️ - Dot,其背后核心的「超强个性记忆」技术被 Mem0 给开源了!🔥 目前 9.5K Star ⭐️
- 🪄 Sonnet 烂图重造:截图就能发帖
- 中国现行有十八个税种
- Congrats @openai on the new GPT-4o mini release!
- GPT-4o mini 太香了,在窗口大小、成本、速度、性能取得了目前最好的折中,提高了整体智能水位 ⚡️
- 最具成本效益的智能!🔥GPT-4o mini 最值得关心的几点:
- 窗口:RAG 之神,总 128K 窗口,最大输出 16K(目前最大)
- 价格:输入 0.15,输出 0.6,是 3.5 的 60%,是 4o 的 3%(最便宜)
- 性能:MMLU 82%,综合能力优于 GPT-4 (同级最强),数学和代码能力接近4o
- 延迟:183 tok/s(最快)
- A Survey of Prompt Engineering Methods in LLMs
- 前 OpenAI 创始人,特斯拉自动驾驶团队负责人 @karpathy 新「AI + 教育」公司首秀课程 「LLM101n」大纲放出⚡️,课程还未发布,已经 21.3K Star ⭐️
- Look forward to attending @icmlconf next week 🇦🇹! Pls join us at our Long-Context Foundation Models workshop: http://longcontextfm.github.io
- 继 《CriticGPT》之后 OpenAI 又发布新论文⚡️💥!《证明者-验证者游戏提高语言模型输出的可读性》
- 最近使用豆包的浏览器插件频率越来越高了。刚刚又上线了播客和视频总结功能,不仅可以总结视频还可以增加多级目录和思维导图
- 十个简单快速提升气场的方法
- 就在刚刚!第一个「为AI 构建搜索引擎」的 AI 搜索 Exa 宣布 1700 万美金 A 轮融资⚡️
- 超越 Claude 3.5 Sonnet 和 GPT-4o!1050 tok/s 且支持工具调用?太酷了!💥 @GroqInc 宣布开源 Llama3 8B/70B 的 Groq Tool Use 微调模型!
- 十种强到可怕的境界
- 本地版的GraphRAG:GraphRAG-Ollama-UI
- 商用级水准!🔥 RAG 数据清洗关键组件,独创 PDF 内容抽取的 「布局识别」和 「公式识别」模型,达到 SOTA!PDF-Extract-Kit 开源
- 一个新的可以在移动设备运行的小型 LLM SmolLM
- Can 𝐦𝐚𝐜𝐡𝐢𝐧𝐞 𝐮𝐧𝐥𝐞𝐚𝐫𝐧𝐢𝐧𝐠 make language models forget their training data?
- 程序员福音,提升 10x 命令行使用效率?Github Copilot X CLI 开源平替来了!🔥 AI Shell 支持你通过自然语言在命令行中语义搜索操作命令!目前已开源 3.8K Star ⭐️
- New model drop from @MistralAI - MathΣtral-7B with 32k context window and Codestral Mamba 7B 🔥
- On-device deployment of LLMs is more important than ever. Today we’re releasing SmolLM a new SOTA series of 135M, 360M and 1.7B models:
- Outperforming MobileLLM, Phi1.5 and Qwen2 small models
- Trained on SmolLM-corpus, of high quality web, code and synthetic data
- OpenAI provides a comprehensive guide on enhancing the accuracy of Large Language Models (LLMs), emphasizing methods to improve response correctness and consistency
- 目测 Mistral 这波要开始带飞 Mamba 架构了😂
- 不了解的小伙伴可以查看 Mamba 的论文:https://arxiv.org/pdf/2312.00752
- Transformer 架构是 「二次方」时间,存在序列长度越长,效率衰减严重的问题,而 Mamba 则号称可以实现「线性」时间推断,和理论无限长度序列的建模,有机会颠覆 Transformer
- Building Robust LLM Applications for Production Grade Scale using @LiteLLM 🚀🔧
- Dokploy 一站式部署平台、Vercel 开源替代品:
- 🔥 支持自托管部署
- ✨ 支持多语言(Node.js、Java、PHP等)应用部署
- 🗃️ 集成数据库管理(MySQL, PostgreSQL, MongoDB, MariaDB, Redis.)
- 🐳 Docker容器管理
- 🔍 实时监控
- 🎯 与Traefik集成实现路由和负载均衡
- GraphRAG 很强,但是使用的话首先需要有一个知识图谱才行,这个提示词可以从给定的内容中提取知识图谱
- 一个股票 API,包含所有 S&P 500 指数的股票。资产负债表、收入报表、现金流报表都有。支持 30 年的数据,正式版会包含一万五千个股票数据。做金融类 AI 应用非常有用
- 太酷啦!⚡️推上有个老哥 @evilsocket 基于 Rust 开源了「异构集群推理方案」,可组合多台 iPhone,iPad,Macbook 组成 Tranformer 推理服务器,运行 Llama3-70B 模型 🔥
- Reddit 爆火的 Claude 3.5 Sonnet 写 Claude Artifacts 的核心 Coding System Prompt 推出 V2版本!🔥
- 🤖 GraphRAG 基建:Camel 知识图谱构建
- 听说这个是 Claude 3.5 Sonnet 写 Claude Artifacts 的核心 System Prompt 🙂👇🏻 在 Reddit 上面传疯了,反正我学会了😂
- 斯坦福开源的一个基于LLM的知识管理系统:storm(perplexity pages的平替)
- 由 @rasbt 撰写并开源的 《从零开始学习 LLM/大模型》,实战教学从零实现一个 LLM 太棒了!⚡️ 短时间内已经飙升 21.9K Star ⭐️
- InferenceClient of @huggingface now supports OpenAI's Python Client
- As a special weekend release, we’ve implemented an initial working implementation of GraphRAG concepts in @llama_index [in beta]
RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对
从零预训练LLAMA3的完整指南:一个文件,探索Scaling Law
KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」
大模型处理29个NLP任务的39种prompt策略总结:兼看2024上半年大模型发展回顾
仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式
提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使
咦?我从GPT-4o mini身上看到了两家中国大模型厂商的影子
可图IP-adapter-plus开源,魔搭送你一本中文咒语书
Hugging Face推出可在手机端运行的小模型;OpenAI用小模型解决“黑盒”难题!
搞不定结构化prompt优化,用微软的Uniprompt结构化语义分解框架搞定它
YOLO-World:基于视觉语言模型的实时开放词汇物体检测
Mamba写代码真的超越Transformer!原始论文入选顶流新会议
🌟 阿里云服务领域Agent智能体:从概念到落地的思考、设计与实践
魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理
Reddit传疯的Claude 3.5 Artifacts 的核心系统提示词!Code效果猛增
平安科技发表大模型智能客服框架PCA,助力企业级对话系统建设
万字长文,从结构化知识到自然语言理解:探索KG-LLM协同的无限可能
LLM推理加速3:推理优化总结Mooncake/AttentionStore/vllm0.5/cache优化 etc
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
从关键词匹配到知识理解:微软 GraphRAG 掀起革命,Neo4j CTO 详解其如何引领智能检索新时代
⭐️ Go & 云原生 & Rust 相关
- rust-ontologist - 一秒生成代码关系图
- kartoffels - 利用Rust写bot,上传到服务器进行对战
- ruskel - 利用LLM生成对crate的概览
- 如何组织大型Rust代码库
- A web chat app for teams, sass with user management and rate-limit, support ChatGPT(openAI & azure), claude, gemini and ollama model #golang based API
- Discover how to create native Mac apps easily with Go using DarwinKit. Latest update features 33 frameworks and near full Apple API coverage
- "HTMX + Go : Build a CRUD App with Goland HTMX" by @coderonfleek #golang #DEVCommunity
- Deep Dive into Go: Crafting a CRUD RESTful API Without Frameworks
- FanIn-FanOut Concurrency Pattern in #Golang
7 张图,彻底讲透 Prometheus 架构原理,收藏备用
Linux 中停止 Docker 服务报 warning 导致无法彻底停止问题如何解决
Go 1.23 Release Candidate 2 is released!
Go 夜读第 157 期从 0 到 1 用 Claude.ai 开发个人作品集网站
Enhancing Kubernetes API - 挂载K8S资源为本地云盘
Rust必知必会库001: thiserror 和 anyhow
📒 后端相关
🌟 如何理解:业务架构、应用架构、数据架构、技术架构与系统和复杂度
云消息队列 RabbitMQ 版入门训练营,解锁对比开源优势与零基础实战
📒 前端相关
豆包Marscode体验官:用云编译器半小时完成轮播组件紧急开发!被公司奖励500!
7月14日内容汇总
封面图:Safe by construction - Roberto Clapis
🌟 AI 相关
- Extrinsic Hallucinations in LLMs
- Building Smarter Agents with @llama_index and Qdrant's Hybrid Search 🦙🔍
- FlashAttention-3 is now available. 1.5-2.0x faster than FlashAttention-2 with FP16, up to 740 TFLOPS 🤯
- Producthunt上个月的第一名产品。Recall是一款帮助你总结和管理在线内容的工具。支持YouTube视频、文章、播客、PDF文件等总结摘要。自动分类并保存在个人知识库中,支持二次编辑。内容自动会生成知识卡片,通过知识图谱建立内容关联。另外,Recall用科学间隔重复和主动回忆方法复习,就是基于内容生成问答题,每天选择题复习。[1]
- 伯克利提出 《从模型到复合人工智能系统的转变》,而 @FireworksAI_HQ 最近融资 5.5 亿美金也是帮企业构建 Compound AI🔥,即:[2]
- 组合框架和策略
- 使用 DSPy 等自动优化 Prompt 质量
- 使用 FrugalGPT 等实现 LLM 负载均衡以及意图路由
- 构建良好的 LLMOps/DataOps 系统
- Reinforcement Learning from Human Feedback (RLHF) workflow and implementation with @MSFTDeepSpeed - A long thread 👇
- 从任意非结构化数据构建知识图谱!@neo4j 正式开源 GraphRAG 的图谱构建工具 LLM Graph Builder! 🔥
- We’re excited to feature LlamaTrace - a collaborative effort with @arizeai to introduce advanced LLM tracing, observability, and evaluation for any LLM application workflows 🦙🔥
- GraphRAG 是 RAG 领域可以造就下一个 Google 的技术!随着最近微软开源 GraphRAG 并将其带上热点顶峰,Neo4j 接着就发布《GraphRAG 宣言》!🔥
- 介绍了 GraphRAG 最全面的技术,包括学习教程,以及端到端的开源技术栈,同时 GraphRAG 在 43 个业务问题中准确性平均提高 3x ⚡️
- 逛 Github 的时候看到一个用简单英语来学习 Rust 的教程「Rust explained using easy English」挺有意思,很适合中文程序员去阅读,甚至没有太大压力的方式可以跟着教程学习,即可当做 Rust 基础了解,也可以当做英语复习,挺不错。
- 不出意外 🤨 大模型/机器学习版本的 LeetCode 来了!目前已经有 26 道题目,经典的矩阵、线性回归、反向传播单神经元实现等题目都有
- 感觉 AI Engineer 目前还没有特别的面试标准,但是未来企业又缺口巨大,这里面可能有一些机会🧐
- This paper claims that Llama3-8B+BoT (Buffer of Thoughts) has the potential to surpass Llama3-70B model. 🤯
- 🚀Excited to introduce Quest: an efficient long-context LLM inference framework, accepted by ICML 2024!🌟
- Last week we launched llama-agents, a brand new multi-agent deployment framework, and the response has been enthusiastic -- the repo is at 1100 stars and counting!
- 这一期播客还挺有意思的,大概定义了 AI Native 的产品研发方式:从迭代确定性的逻辑转向迭代 「测试集」和 「训练集」
- Prompt越写越多,而且有版本管理的需求,想找一个管理工具。发现了Pezzo
- You can now fine-tune Claude 3 Haiku—our fastest and most cost-effective model—in Amazon Bedrock
- 超实用,Perplexity Pages 开源平替!可浏览网络生成长达「几万字」的长篇文章/研究论文,免费使用还带引用!🔥 斯坦福 Storm 2.0 重磅发布⚡️
- 11个AI程序员(偏后端)项目汇总
- RAG 2.0 新范式来了 !11.3 K Star 🌟 的RAGFlow 0.8 版本正式发布 Agentic Workflow,基于有环图为 RAG 引入带反思的 Agent 能力
- 学术福音⚡️!基于交互式,可实操的 Demo 理解 CNN/Transformer 的工作原理,已开源 7.6K Star 🌟
- We've added new features to the Anthropic Console. Claude can generate prompts, create test variables, and show you the outputs of prompts side by side
- HippoRAG is able to obtain comparable performance to iterative RAG methods (IRCoT) while being 10-30x faster and 6-13x cheaper. 🤯
- We’re excited to release a comprehensive set of video tutorials on GraphRAG 🧑🏫, using the latest property graph abstractions in @llama_index
- 解决 RAG 最致命的「验证信息可信度」问题,将人类 「海马体」机制引入大模型 RAG 技术的 HippoRAG 发布!⚡️
- 无需微调,引入知识图谱、PageRank和检索编码器技术
- 在多跳问题回答上,性能提升 3~20%
- 相比迭代式 RAG(如 IRCoT),成本优化 10~30 倍,速度快 6~13 倍
- Andrej Karpathy 大神的这个「让我们来搞一个GPT-2」很值得跟着学习一遍,124分钟的长视频,受限构建 GPT-2 网络,然后优化对应训练速度,并按照 GPT-2 和 GPT-3 论文参数设置训练运行,挺适合周末时间我们来照着视频学习一下。
- 160+ 行代码手搓 GPT-4o 演示版的实时音视频通话能力并开源🔥,作者还录制了教程视频!⚡️
- 英伟达又在 RAG 领域整了个大活!🔥,RankRAG 来了!无需微调,利用基于 Llama3 的 Retrieve-Rerank-Generate 流程,在 9 个知识密集型基准测试中明显优于 GPT-4⚡️
- Incredible results for the RAG world from @nvidia model 👏. Llama3-RankRAG from @nvidia significantly outperforms GPT-4 models on 9 knowledge-intensive benchmarks. 🤯
- 增强LLM具备AI产品化能力的17种RAG技术
- One Single Script to run the all the three steps of Reinforcement Learning from Human Feedback (RLHF) Training with DeepSpeed-Chat
- Wrote quite a lengthy blog - "Reinforcement Learning from Human Feedback (RLHF) in Practice: A Deep Dive" 👨🔧
- LlamaIndex 创始人 @jerryjliu0 在 AI Engineer 世界大会 @aiDotEngineer 上分享《知识助手的未来》,并正式发布并开源 Agentic RAG 框架 - LlamaAgents 🔥,目前 878 Star 🌟
- 多 Agent 框架,使用 Docker/K8S 部署
- 完善可观测、显示的 Control 模式、发布为 Tool/API
- HippoRAG 无需微调,使用现成技术:
- LLM 推理关键点和意图
- 知识图谱构建知识关联性
- 检索+个性化PageRank从知识图谱里面整合最关联的片段,并实现高效搜索
- 感觉后续大模型 RAG 技术进一步发展就是传统算法+LLM 结合,进入下一个阶段,而非知识裸的检索然后丢给模型答一下 🤔
- 斯坦福爆火的 Prompt 编程框架 DSPy 的 TypeScript 实现来了!ax 实现了 DSPy 支持构建复杂 Agentic Workflow,目前已开源,697 Star 🌟
- The "Multi-token Prediction" paper (April-2024) from @AIatMeta and behind the Chameleon family of models is such an innovative idea
- Shadcn/UI 推出全新的图表了,好看!
- Laisky 的这个「面向 Web2 工程师的 Web3 入门」Slides 挺值得一看,让 Web2 工程师更好理解,介绍以区块链技术为核心的 Web3 相关基础知识,主要围绕 blockchain 的基本概念,主要关注技术实现和日常操作。
- 获 YC 投资,为企业构建一站式内部 Agent 和 RAG 应用解决方案的 Mintplex Labs 开源其跨端应用 anything-llm,并冲上 Github Trending 第一名🔥,目前 16.8K Star 🌟
Meta | 提出System 2蒸馏方法,Llama 2对话模型任务准确率接近100%!
🌟 LLM之RAG实战(二十五)| 使用LlamaIndex和BM25重排序实践
🌟 Hybrid Search: 利用BM25算法和语义搜索提升RAG系统性能
Lookback Lens:用注意力图检测和减轻llm的幻觉
Stability AI修改协议Stable Diffusion 3 Medium可以免费商业化应用
RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡
OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
Modelscope-Agent 增强RAG能力:(二)多源召回,自定义图片解析
AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题
万字长文,代码详解Memory3:革命性RAG模型如何重新定义大规模语言模型
综述!清华 && 剑桥 | 深入探讨大模型(LLMs)知识冲突的研究进展及挑战
社区供稿 | 源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程
谷歌 | 提出新型层设计:PEER,可对百万专家进行稀疏检索,超越密集前馈、稀疏MoE
人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
深入探讨提示工程的攻击与防范:从理论到实践【附大语言模型提示注入攻击安全风险分析报告】
🌟 LLM 大模型学习必知必会系列(四):LLM训练理论篇以及Transformer结构模型详解
🌟 斯坦福最新警示 | 别被RAG模型骗了:看LLM如何通过Prompt权衡先验知识与RAG检索
苹果大模型Siri将至;InternLM2.5-7B可免费商用;TTT超越Transformer和Mamba|青稞日报07.08
微软&清华提出全新预训练范式,指令预训练让8B模型实力暴涨!实力碾压70B模型
IAAR && 北大 | 为大模型配备显式记忆,降低成本,提升大模型推理速度!
彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态
理解时间戳的视频理解大模型CogVLM2开源!视频生成、视频摘要等任务有力工具!
激活函数的进化之旅:从Sigmoid到SwiGLU,深度学习的神经触发器
Mobile-Agent-V1/V2:基于多模态Agent架构的手机智能体
开源VLM新标杆 InternVL 2.0 怎么用?部署、微调尽在魔搭社区!
微软 MInference:百万 Token 序列,10x 加速
⭐️ Go & 云原生 & Rust 相关
- SeekStorm - 一个亚毫秒级的全文搜索引擎
- 非常快。同时还支持多租户系统。这个项目是由其它项目转过来用Rust重写的,之前那个项目已经搞了很多年了。
- blog:通过合并链接表来学习Rust的所有权
- 使用 Rust, Jupyter 和 Anaconda 来做数据分析
- 已经有专门的使用Rust来做数据分析和处理的书了。现在AI pipeline中,使用Rust来代替python做预训练前的数据准备工作已经成了一种趋势了。
- Backend Project Structure Go
- Tricky Golang interview questions - Part 6: NonBlocking Read
- A Go-based SSH client designed as a drop-in replacement for the OpenSSH client
- A simple backend implementation of Clean Architecture using Gin/Gorm with Dependency Injection
- Understanding Go's Garbage Collector: A Detailed Guide
- 发现一个可以把日志文件高亮的命令行工具 Tailspin,安装后把原来查看命令换成 tspin 即可看到下面这种效果的日志,更加便于阅读和排查问题。
- An interesting article: "How I write HTTP services in Go after 13 years"
- If you have many equal strings which don't share underlying bytes memory, then, since #Golang 1.23, you can use the following shown Canonicalize function to let them share underlying bytes memory, so that much memory will get freed
- Go 1.23 adds a "CopyFS" function in the "os" std package
- Learn how to build your own distributed key-value storage system using the etcd Raft library. Dive into the architecture and code analysis!
Go语言标准库中math/rand
包的改进和math/rand/v2
包的引入
代码提交即部署:Argo Workflows 与 EventBridge 构建自动化 CI
链路追踪详解(六):Zipkin 和 Jaeger 的安装方法
Go 1.23 的 os.CopyFS:告别第三方库,轻松复制目录
🌟 5 Better ways to code in Rust
全面掌握 Go 语言 errors 标准库:使用指南与源码深度解析
Go 性能度量利器,完全替代 io.Reader 和 io.Writer!
震惊! Go 1.23中Timer无buffer的实现方式竟是这样!
Golang Channel 模式:Retry timeout
📒 后端相关
国内用户如何使用 DuckDB 访问 Hugging Face 上超15万 数据集
12 个电商核心业务系统,如此复杂的中台业务一篇文章就能讲明白
秒杀圣经(2): 16大绝招,完成10Wqps秒杀架构(3万字架构长文)
📒 前端相关
性能飙升50%,react-virtualized-list如何优化大数据集滚动渲染
Next.js 项目写 Tailwind CSS 基本都会遇到的两个问题