Skip to main content

7月14日内容汇总

· 19 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

技术资讯

Meta | 提出System 2蒸馏方法,Llama 2对话模型任务准确率接近100%!

🌟 LLM之RAG实战(二十五)| 使用LlamaIndex和BM25重排序实践

🌟 Hybrid Search: 利用BM25算法和语义搜索提升RAG系统性能

Lookback Lens:用注意力图检测和减轻llm的幻觉

LLM代理应用实战:构建Plotly数据可视化代理

Stability AI修改协议Stable Diffusion 3 Medium可以免费商业化应用

RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡

OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服

OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级

ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

又来一个RAG:RankRAG,英伟达RAG新思路

Modelscope-Agent 增强RAG能力:(二)多源召回,自定义图片解析

AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

万字长文,代码详解Memory3:革命性RAG模型如何重新定义大规模语言模型

综述!清华 && 剑桥 | 深入探讨大模型(LLMs)知识冲突的研究进展及挑战

绘梦有形,快手开源「可图 Kolors」,等你来玩

社区供稿 | 源大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

谷歌 | 提出新型层设计:PEER,可对百万专家进行稀疏检索,超越密集前馈、稀疏MoE

人人可做提示工程师!Claude上新:一键生成、测试和评估prompt

平安科技新成果:PCA,基于外部决策工具的智能客服框架

深入探讨提示工程的攻击与防范:从理论到实践【附大语言模型提示注入攻击安全风险分析报告】

BM42横空出世!BM25统御搜索引擎40年,终于要落幕了

🌟 源码解读 - 微软GraphRAG框架

🌟 LLM 大模型学习必知必会系列(四):LLM训练理论篇以及Transformer结构模型详解

🌟 斯坦福最新警示 | 别被RAG模型骗了:看LLM如何通过Prompt权衡先验知识与RAG检索

RAG还得靠大佬!NVIDIA新模型让GPT-4都吃灰

苹果大模型Siri将至;InternLM2.5-7B可免费商用;TTT超越Transformer和Mamba|青稞日报07.08

不是H100租不起,而GPU混布更有性价比!

多模态模型(VLM)部署方法抛砖引玉

微软&清华提出全新预训练范式,指令预训练让8B模型实力暴涨!实力碾压70B模型

IAAR && 北大 | 为大模型配备显式记忆,降低成本,提升大模型推理速度!

彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态

理解时间戳的视频理解大模型CogVLM2开源!视频生成、视频摘要等任务有力工具!

激活函数的进化之旅:从Sigmoid到SwiGLU,深度学习的神经触发器

Mobile-Agent-V1/V2:基于多模态Agent架构的手机智能体

开源VLM新标杆 InternVL 2.0 怎么用?部署、微调尽在魔搭社区!

微软 MInference:百万 Token 序列,10x 加速

压缩下一个token通向超过人类的智能

⭐️ Go & 云原生 & Rust 相关

盘点 Rust 中的那些天才构思

构建并运行 eBPF 应用 - Part 1

想知道海外技术面试都考些什么吗

🌟 [] Rust标准库有些特殊,让我们改变它

Go语言标准库中math/rand包的改进和math/rand/v2包的引入

代码提交即部署:Argo Workflows 与 EventBridge 构建自动化 CI

链路追踪详解(六):Zipkin 和 Jaeger 的安装方法

Kubernets的NVIDIA设备插件安装方案实践

Go 1.23 的 os.CopyFS:告别第三方库,轻松复制目录

在Go项目中使用Redis的几个实用建议

使用SIMD优化二叉搜索树

🌟 5 Better ways to code in Rust

全面掌握 Go 语言 errors 标准库:使用指南与源码深度解析

Go 语言 API 限流实战:保障系统稳定性的护盾

Go 性能度量利器,完全替代 io.Reader 和 io.Writer!

rsc 给 Go 社区写了个 AI 机器人,他很满意!

Rust多线程编程和异步编程

震惊! Go 1.23中Timer无buffer的实现方式竟是这样!

Golang Channel 模式:Retry timeout

对过去一年多的 AI 轮子们碎碎念

cgo 内存优化后续 - 修了个 bug

📒 后端相关

🌟 万字聊一聊DDD领域驱动设计理论

快停下,Redis 都要被你玩坏了

国内用户如何使用 DuckDB 访问 Hugging Face 上超15万 数据集

紧急生产问题:线上kafka百万消息积压如何处理

微服务循环依赖引发惨案,有坑!

写出漂亮代码的45个小技巧,你知道几个?还不收藏

3个企业级最佳实践,教你ByteHouse云数仓这么用

阿里面试:canal+MQ,会有乱序的问题吗

在线人数统计功能怎么实现

12 个电商核心业务系统,如此复杂的中台业务一篇文章就能讲明白

Rust 中跨平台获取 MAC 地址

秒杀圣经(2): 16大绝招,完成10Wqps秒杀架构(3万字架构长文)

干货 | 携程门票「秒杀系统」的设计与实践

在过去三年中,DuckDB 的速度提升了 3-25 倍

📒 前端相关

如何开发一款 JSSDK

数据智能|交互新探索:大模型时代可视化应用的交互新可能

性能飙升50%,react-virtualized-list如何优化大数据集滚动渲染

Next.js 项目写 Tailwind CSS 基本都会遇到的两个问题

构建更快的 Web 体验 - 使用 postTask 调度器

前端工程化系列二:编码提效