AI APP 日報 Pulsar
LIVE
AI APP 線AI APP 线 · 行業行业 · 工具 · 趨勢趋势
- Gemini 3.1 Pro 正式发布:复杂推理能力翻倍 Google 新模型在 ARC-AGI-2 基准上得分 77.1%,是 3.0 Pro 的两倍多,专为复杂科学、研究和 agentic 工作流设计 WEB
- Anthropic 官方推出 Claude Code 安全功能 内置漏洞扫描和修复能力,可检测 500+ 个开源代码库中的未知漏洞,采用多阶段验证和人工审批机制 WEB
- Qwen3.5 开源:397B 多模态原生智能体 阿里通义千问支持文本、图像、视频输入,MoE 架构(397B 总参数,17B 激活),上下文长度达 262K WEB
- Electrobun:智能体技能框架与开发方法论 blackboardsh 推出的跨平台桌面应用框架,集成 agentic skills 范式,支持可重用的 AI 工作流 GITHUB
- Anthropic 发布 AI 智能体自主性实证研究 基于数百万次交互数据,发现用户经验越丰富,对智能体的自动批准率越高(从 20% 升至 40-50%) WEB
- anthropics/claude-plugins-official Anthropic 官方维护的 Claude Code 插件目录,包含安全指导等官方插件 GITHUB
- LLMs grading other LLMs 社区讨论使用 LLM 评估其他 LLM 的有效性,获得大量关注和深度讨论 REDDIT
— VLA 線今日無資料 —— VLA 线今日无资料 —