Skip to main content

7月7日内容汇总

· 17 min read
加菲猫

alt text

封面图:Safe by construction - Roberto Clapis

🌟 AI 相关

技术资讯

LLM+本地知识库?简单又没那么简单

你想要的GraphRAG的内容都在这了

2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐

RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡

2分钟,需求文档变产品,国产大模型开发神器火爆WAIC

RAGFlow开源Star量破万,是时候思考下RAG的未来是什么了

详解这一年多模态视觉-语言大模型的架构演进

社区供稿 | 加速基于 Arm Neoverse N2 的大语言模型推理

Kimi论文自曝推理架构,80%流量都靠它承担

LLaMA Factory:从预训练到RLHF,大模型高效训练框架

大语言模型超参数入门调参手册

图解大模型计算加速系列:分离式推理架构1,从DistServe谈起

关键点检测标注文件解析(姿态估计)——COCO数据集

可控细节的长文档摘要,探索开源LLM工具与实践

GPT-4预测股票涨跌更更更准了!东京大学新框架LLMFactor提升显著 | ACL 2024

使用‘消除’技术绕过LLM的安全机制,不用训练就可以创建自己的nsfw模型

SOFTS: 时间序列预测的最新模型以及Python使用示例

Claude 3.5 Sonnet 超越 GPT-4o成为最智能的模型,新功能artifacts可以实时查看和迭代生成的代码

Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放

240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开

2024 SOTA多模态大模型架构设计的最佳实践

人类偏好对齐训练技术解析

ICML 2024 Spotlight | 在解码中重新对齐,让语言模型更少幻觉、更符合人类偏好

Web2Code:一款用于网页转代码的全套数据集(含训练数据和评估框架),得分显著提升

AIOps的工业化应用:有 42%的机会让Meta在发现故障后几分钟内就定位到潜在的根本原因

大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程(Pytorch版)

详解这一年多模态视觉-语言大模型的架构演进

🌟 月之暗面kimi底层推理系统方案揭秘

使用CXX进行Rust和C++的安全互操作

Florence-2,小模型推进视觉任务的统一表征

ICML 2024 | 无需LayerNorm简化Attention,精度无损推理效率大幅提升

拆分Transformer注意力,韩国团队让大模型解码提速20倍

模型实操 | 从零开始,用英伟达T4、A10训练小型文生视频模型

BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

打败GPT4!仅用1/24成本的混合智能体架构逆袭 (mixture of agents)

Meta:悄悄发布多款模型、研究和数据集

llama-index团队开源面向生产级多智能体系统的开源框架:llama-agent

提示工程策略:利用【慢思考】的双过程理论减少模型有害输出

从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定

ICML2024 & 北大|探究Transformer如何进行推理?基于样例还是基于规则

LLM Agent的规划能力如何重塑AI的未来

kimi chat大模型的200万长度无损上下文可能是如何做到的

大模型推理优化技术-KV Cache

⭐️ Go & 云原生 & Rust 相关

Golang 开发不能错过的优质的开源项目

从 Docker Hub 拉取镜像受阻?这些解决方案帮你轻松应对

🌟 从零开始:使用 pyo3-arrow 打造高效的 Python-Rust 数据桥梁

Go 的 iota 并非枚举

Go语言助力安全测试:24小时内发送5亿次HTTP/1.1请求

使用 Go 提供的 Cookie 库简化 Cookie 操作

在 Rust 中轻松转换 HTML 到 Markdown

Golang 编写范型集合,官方文档未提及的诀窍

以 Go 语言为例解释什么是伪共享以及如何解决

[Go Official]Go 1.22 升级后的更加鲁棒的切片操作

Go 1.23中的自定义迭代器与iter包

Go必知必会:解锁 Go 语言函数的玩法

如何架构优秀的Go后端REST API服务

Go 1.22.5 修复 net/http 包中由于不正确的 100-continue 处理而拒绝服务的安全问题

在 Go 中如何检查结构体是否为空

🌟 gaby:基于大模型的GitHub助手亮相Go项目

Golang 对接并部署 helm charts

Go 使用 interface 时的 7 个常见错误

Docker镜像拉取最优解!养一只小猫,利用crproxy高速无感镜像拉取

qsv:Rust实现一个处理CSV文件的简单,快速和可组合的命令行工具

如何设计一个分布式数据实时同步系统

📒 后端相关

告别面条代码,让代码一开始就简洁

不是,你还在随便设计数据库字段类型和长度

秒杀圣经:10Wqps高并发秒杀,16大架构杀招,帮你秒变架构师

从一个服务预热不生效问题谈微服务无损上线

Spring Cloud + Nacos + 负载均衡器实现全链路灰度发布实战

Navicat 竟然免费了?可惜我有更好用的。。

🌟 MySQL日志15连问,你能抗住嘛

【收藏】MySQL 超全优化清单(可执行系列)

电商后端开发,COLA 状态机在订单系统中的实战

熔断、隔离、重试、降级、超时、限流,一文帮你顺理高可用架构流量治理

架构之道:人人都是架构师

🌟 11个高可用设计实战技巧,轻松应对大厂面试

🌟 订单支付超时如何处理?盘点延迟任务的11种实现方式,你知道几种

🌟 DuckDB 纯 SQL 实现混合搜索:精准与语义兼得

DuckDB实战:单机2.5小时处理450GB投票数据

使用懒加载 + 零拷贝后,程序的秒开率提升至99.99%

elasticSearch 是什么?工作原理是怎么样的

📒 前端相关

React 19 新 hook —— useActionState 与 Next.js Server Actions 绝佳搭配

实现一个支持@的输入框

前端工程化系列一:序言

前端项目路径别名终极解决方案

老板:给你20天,写一个可拖拽动态表单生成器

Chrome 127 内置 AI Gemini 大模型,JS 可直接调用!

周百万下载量的 NPM 包可执行任意 JS 代码,数十万网站可能受影响!

前端可以玩“锁”了