封面图:Go 1.23 Release Candidate 2 is released!
🌟 AI 相关
- GPT-4o mini: advancing cost-efficient intelligence
- 获 OpenAI 370 万美金投资,「连接你生活点滴」的爆火的 AI 应用⚡️ - Dot,其背后核心的「超强个性记忆」技术被 Mem0 给开源了!🔥 目前 9.5K Star ⭐️
- 🪄 Sonnet 烂图重造:截图就能发帖
- 中国现行有十八个税种
- Congrats @openai on the new GPT-4o mini release!
- GPT-4o mini 太香了,在窗口大小、成本、速度、性能取得了目前最好的折中,提高了整体智能水位 ⚡️
- 最具成本效益的智能!🔥GPT-4o mini 最值得关心的几点:
- 窗口:RAG 之神,总 128K 窗口,最大输出 16K(目前最大)
- 价格:输入 0.15,输出 0.6,是 3.5 的 60%,是 4o 的 3%(最便宜)
- 性能:MMLU 82%,综合能力优于 GPT-4 (同级最强),数学和代码能力接近4o
- 延迟:183 tok/s(最快)
- A Survey of Prompt Engineering Methods in LLMs
- 前 OpenAI 创始人,特斯拉自动驾驶团队负责人 @karpathy 新「AI + 教育」公司首秀课程 「LLM101n」大纲放出⚡️,课程还未发布,已经 21.3K Star ⭐️
- Look forward to attending @icmlconf next week 🇦🇹! Pls join us at our Long-Context Foundation Models workshop: http://longcontextfm.github.io
- 继 《CriticGPT》之后 OpenAI 又发布新论文⚡️💥!《证明者-验证者游戏提高语言模型输出的可读性》
- 最近使用豆包的浏览器插件频率越来越高了。刚刚又上线了播客和视频总结功能,不仅可以总结视频还可以增加多级目录和思维导图
- 十个简单快速提升气场的方法
- 就在刚刚!第一个「为AI 构建搜索引擎」的 AI 搜索 Exa 宣布 1700 万美金 A 轮融资⚡️
- 超越 Claude 3.5 Sonnet 和 GPT-4o!1050 tok/s 且支持工具调用?太酷了!💥 @GroqInc 宣布开源 Llama3 8B/70B 的 Groq Tool Use 微调模型!
- 十种强到可怕的境界
- 本地版的GraphRAG:GraphRAG-Ollama-UI
- 商用级水准!🔥 RAG 数据清洗关键组件,独创 PDF 内容抽取的 「布局识别」和 「公式识别」模型,达到 SOTA!PDF-Extract-Kit 开源
- 一个新的可以在移动设备运行的小型 LLM SmolLM
- Can 𝐦𝐚𝐜𝐡𝐢𝐧𝐞 𝐮𝐧𝐥𝐞𝐚𝐫𝐧𝐢𝐧𝐠 make language models forget their training data?
- 程序员福音,提升 10x 命令行使用效率?Github Copilot X CLI 开源平替来了!🔥 AI Shell 支持你通过自然语言在命令行中语义搜索操作命令!目前已开源 3.8K Star ⭐️
- New model drop from @MistralAI - MathΣtral-7B with 32k context window and Codestral Mamba 7B 🔥
- On-device deployment of LLMs is more important than ever. Today we’re releasing SmolLM a new SOTA series of 135M, 360M and 1.7B models:
- Outperforming MobileLLM, Phi1.5 and Qwen2 small models
- Trained on SmolLM-corpus, of high quality web, code and synthetic data
- OpenAI provides a comprehensive guide on enhancing the accuracy of Large Language Models (LLMs), emphasizing methods to improve response correctness and consistency
- 目测 Mistral 这波要开始带飞 Mamba 架构了😂
- 不了解的小伙伴可以查看 Mamba 的论文:https://arxiv.org/pdf/2312.00752
- Transformer 架构是 「二次方」时间,存在序列长度越长,效率衰减严重的问题,而 Mamba 则号称可以实现「线性」时间推断,和理论无限长度序列的建模,有机会颠覆 Transformer
- Building Robust LLM Applications for Production Grade Scale using @LiteLLM 🚀🔧
- Dokploy 一站式部署平台、Vercel 开源替代品:
- 🔥 支持自托管部署
- ✨ 支持多语言(Node.js、Java、PHP等)应用部署
- 🗃️ 集成数据库管理(MySQL, PostgreSQL, MongoDB, MariaDB, Redis.)
- 🐳 Docker容器管理
- 🔍 实时监控
- 🎯 与Traefik集成实现路由和负载均衡
- GraphRAG 很强,但是使用的话首先需要有一个知识图谱才行,这个提示词可以从给定的内容中提取知识图谱
- 一个股票 API,包含所有 S&P 500 指数的股票。资产负债表、收入报表、现金流报表都有。支持 30 年的数据,正式版会包含一万五千个股票数据。做金融类 AI 应用非常有用
- 太酷啦!⚡️推上有个老哥 @evilsocket 基于 Rust 开源了「异构集群推理方案」,可组合多台 iPhone,iPad,Macbook 组成 Tranformer 推理服务器,运行 Llama3-70B 模型 🔥
- Reddit 爆火的 Claude 3.5 Sonnet 写 Claude Artifacts 的核心 Coding System Prompt 推出 V2版本!🔥
- 🤖 GraphRAG 基建:Camel 知识图谱构建
- 听说这个是 Claude 3.5 Sonnet 写 Claude Artifacts 的核心 System Prompt 🙂👇🏻 在 Reddit 上面传疯了,反正我学会了😂
- 斯坦福开源的一个基于LLM的知识管理系统:storm(perplexity pages的平替)
- 由 @rasbt 撰写并开源的 《从零开始学习 LLM/大模型》,实战教学从零实现一个 LLM 太棒了!⚡️ 短时间内已经飙升 21.9K Star ⭐️
- InferenceClient of @huggingface now supports OpenAI's Python Client
- As a special weekend release, we’ve implemented an initial working implementation of GraphRAG concepts in @llama_index [in beta]
RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对
从零预训练LLAMA3的完整指南:一个文件,探索Scaling Law
KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」
大模型处理29个NLP任务的39种prompt策略总结:兼看2024上半年大模型发展回顾
仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式
提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使
咦?我从GPT-4o mini身上看到了两家中国大模型厂商的影子
可图IP-adapter-plus开源,魔搭送你一本中文咒语书
Hugging Face推出可在手机端运行的小模型;OpenAI用小模型解决“黑盒”难题!
搞不定结构化prompt优化,用微软的Uniprompt结构化语义分解框架搞定它
YOLO-World:基于视觉语言模型的实时开放词汇物体检测
Mamba写代码真的超越Transformer!原始论文入选顶流新会议
🌟 阿里云服务领域Agent智能体:从概念到落地的思考、设计与实践
魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理
Reddit传疯的Claude 3.5 Artifacts 的核心系统提示词!Code效果猛增
平安科技发表大模型智能客服框架PCA,助力企业级对话系统建设
万字长文,从结构化知识到自然语言理解:探索KG-LLM协同的无限可能
LLM推理加速3:推理优化总结Mooncake/AttentionStore/vllm0.5/cache优化 etc
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
从关键词匹配到知识理解:微软 GraphRAG 掀起革命,Neo4j CTO 详解其如何引领智能检索新时代
⭐️ Go & 云原生 & Rust 相关
- rust-ontologist - 一秒生成代码关系图
- kartoffels - 利用Rust写bot,上传到服务器进行对战
- ruskel - 利用LLM生成对crate的概览
- 如何组织大型Rust代码库
- A web chat app for teams, sass with user management and rate-limit, support ChatGPT(openAI & azure), claude, gemini and ollama model #golang based API
- Discover how to create native Mac apps easily with Go using DarwinKit. Latest update features 33 frameworks and near full Apple API coverage
- "HTMX + Go : Build a CRUD App with Goland HTMX" by @coderonfleek #golang #DEVCommunity
- Deep Dive into Go: Crafting a CRUD RESTful API Without Frameworks
- FanIn-FanOut Concurrency Pattern in #Golang
7 张图,彻底讲透 Prometheus 架构原理,收藏备用
Linux 中停止 Docker 服务报 warning 导致无法彻底停止问题如何解决
Go 1.23 Release Candidate 2 is released!
Go 夜读第 157 期从 0 到 1 用 Claude.ai 开发个人作品集网站
Enhancing Kubernetes API - 挂载K8S资源为本地云盘
Rust必知必会库001: thiserror 和 anyhow
📒 后端相关
🌟 如何理解:业务架构、应用架构、数据架构、技术架构与系统和复杂度
云消息队列 RabbitMQ 版入门训练营,解锁对比开源优势与零基础实战
📒 前端相关
豆包Marscode体验官:用云编译器半小时完成轮播组件紧急开发!被公司奖励500!