LearnerForever的个人资料

总结：Grok 3评论 Writesonic发布了一篇文章对xAI开发的Grok 3人工智能模型进行了深入评审，该模型于2025年2月17日发布。基于超过100个提示的测试，评论评估了其性能、优势和不足，将其定位为GPT-4o和Gemini等先进模型的强劲竞争者。核心功能与优势 1.高级推理能力 -Grok 3在科学和技术任务中表现出色，特别是在物理和数学领域。其“大脑模式”（Big Brain模式）增强了处理复杂多步骤问题的能力，提供精确且逻辑严密的解决方案。 -评论强调其在分解复杂查询方面的实力，使其成为需要强大分析支持的用户的首选工具。 2.速度与实时集成 -该模型以速度快著称，即便是面对具有挑战性的问题也能迅速响应。 -与X平台的集成及其“深度搜索”（DeepSearch）功能使Grok 3能够访问实时数据和帖子，确保答案具有时效性并从平台中获得丰富的上下文洞察。 3.目标应用场景 -它在研究驱动和技术性场景中表现突出，为寻求详细、准确和最新信息的用户提供宝贵的支持。弱点与局限性 1.处理理论性查询的困难 -Grok 3在面对高度理论化或定义不明确的问题时表现不佳，缺乏与一些竞争对手一样有效应对模糊性的能力。 2.创意与SEO性能有限 -该模型不适合创意写作或SEO导向的任务。在这些领域，Chatsonic等替代品表现更为优异，尤其是在需要创意或优化时。 3.完善度与多功能性 -与GPT-4o等对手相比，Grok 3在精炼度和广泛适应性上有所欠缺，表明其在全面能力上仍在发展。总体评价评分：评论给予Grok 3 8.5/10的高分，称赞其推理能力和速度是其突出品质。结论：虽然它是技术与科学应用的强大工具，但其较窄的专注领域和偶尔的粗糙边缘意味着它尚未在多功能性或完善度上完全超越竞争对手。这是一个前景光明、优势明显的模型，但仍有成长空间。原文：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwritesonic.com%2Fblog%2Fgrok-3-review&urlrefer=a4ae5429522503edb8f32b493ccf5d3a

grok评测 grok为目前为止最开放的AI，没有之一。

马斯克称Grok3可生成任何街机游戏明年有望制作3A！今日，马斯克在推特上发布了关于Grok 3的最新消息，表示该技术能够生成玩家想出的任何游戏，并乐观的预测，Grok 3可能在2026年制作出一款3A游戏。　　马斯克在推文中提到：“Grok 3能够制作您能想到的任何街机游戏。今年，我们将增加支持高分辨率图像的功能。我认为明年某个时候，我们有机会制作一款3A游戏。”　　推主Min Choi也分享了对这一技术的看法，称马斯克的xAI游戏工作室将彻底改变游戏产业。现在玩家几分钟就能生成游戏，只需通过询问Grok就能进一步改进画面。　　他还列举了生成的10个游戏示例，包括《吃豆人》、《GTA》等游戏，展示了Grok 3的强大潜力。

什么？要出4.5 模型不是又在吹吧，出皮牛皮吧，很早之前就说要出4.5 5x到现在为止官方也没有个动静。玩呢～

deepseek使用体验？昨天用了一下目前貌似审核这块可以钻个漏洞，因为会偶尔跳过审核把内容输出，可以在此期间快速复制出来，因为一旦输出结束系统可能会吧内容全部不隐藏并提示内容违规。另外貌似只能发一次。然后再发就提示“系统正忙，请稍后再试” 有什么办法可以逃过这个吗，本地部署？

Grok 3之后再无更强AI！现场Demo后天见分晓 AI 领域的新霸主即将登场？埃隆 · 马斯克于 2 月 16 日通过社交平台 X 宣布，其旗下 xAI 公司研发的 Grok 3 大模型将于太平洋时间 2 月 17 日晚 8 点 ( 北京时间 2 月 18 日 12 点 ) 正式亮相，并同步开启全球直播演示。马斯克将这款模型誉为“地球上最聪明的人工智能”，称其推理能力已超越包括 ChatGPT、DeepSeek 在内的现有顶尖模型。为确保发布效果，马斯克透露整个周末将与团队全力优化产品，期间将暂时离线。 Grok 大模型诞生于马斯克创立的 xAI 公司，其命名源自科幻小说《陌生人的陌生土地》中的“深刻理解”概念。2023 年 11 月，xAI 推出首代 Grok-1 模型，次年 3 月发布参数量达 3140 亿的开源版本，远超同期 GPT-3.5 的 1750 亿参数。2024 年 8 月发布的 Grok 2 聚焦 AI 聊天机器人训练，通过融合少量真实数据优化了初代模型依赖合成数据导致的场景适应性短板。此次发布的 Grok 3 引入“思维链”推理技术，模拟人类逐步拆解复杂任务的认知过程，显著提升逻辑连贯性。测试显示，其在数学证明等复杂任务中展现出的推理能力已通过国际奥数测试，并支持图像、视频等多模态分析，尤其在自动驾驶数据训练中潜力突出。此外，模型依托 10 万块英伟达 H100 GPU 的超强算力，训练成本堪比小型核电站，但因团队规模限制曾多次推迟发布。在 Grok 3 研发滞后的窗口期，中国团队 DeepSeek 凭借低成本路线异军突起，其混合专家架构 ( MoE ) 在编程、数学等领域表现亮眼。而 Grok 3 选择开源策略与特斯拉生态深度融合，计划接入车载系统及人形机器人，试图构建软硬件协同壁垒。面对 OpenAI 即将推出的 GPT-5 免费版冲击，这场“算力霸权”与“应用场景”的博弈或将重塑 AI 行业格局。

DeepSeek公司主要人员发生变更新增互联网信息服务近日，DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司发生工商变更，裴湉由执行董事兼总经理改任经理、董事，新增王贤祖为财务负责人，同时经营范围新增互联网信息服务。杭州深度求索人工智能基础技术研究有限公司成立于2023年7月，法定代表人为裴湉，注册资本1000万人民币，经营范围包括计算机系统服务、信息系统集成服务、人工智能应用软件开发等，由梁文锋及其名下宁波程恩企业管理咨询合伙企业（有限合伙）共同持股。

美媒：DeepSeek新突破如同一场地震特朗普称DeepSeek 给产业敲响警钟。

特朗普称Deepseek给美国产业敲响警钟美媒：Deep Seek新突破如同一场地震。

招募更多小吧主幻坦吧招募小吧主，有意的留言。

招募小吧主 chatgpt吧小吧主招募渠道已开通，共同维护chatgpt吧交流环境。小吧主不可以发布广告，保持一定在线时长，公平公正。

支持deepseek 支持国产AI，欢迎吧友讨论。吧友可以多尝试，无论哪一款AI，都帮助我们提高效率，AI之间的竞争收益的将会是用户，我们反对任何形式的垄断。

写下祝福语，开启幸运年【抽奖时间】2025年01月28日20:00自动抽奖【参与范围】关注chatgpt吧且吧等级>=4级的吧友【参与方式】带关键词「#新春祝福#」评论本贴【奖品信息】贴吧SVIP*2 【领奖有效期】中奖吧友请在2025年02月28日23:59前完成领奖 2025年，新年新气象，愿吧友们在新的一年中都能实现自己的目标，身体健康，财源滚滚，收获满满的幸福与快乐！新的开始，新的希望！快来留言留下你的新年祝福，一起分享这份喜悦，还有幸运抽奖等着你哦！注：中奖后请联系吧主领取贴吧SVIP兑换码。

#王者荣耀#限时点券王者荣耀送限时点券啦！复制我的福气码【地狱之眼5V6MMH】前往活动，参与小王送福中大奖!

OpenAI确认了转型计划，将成为一家营利性公司 OpenAI CEO山姆·奥特曼。图片来源：GETTY OpenAI首席执行官山姆·奥特曼表示，他的公司特意采用了“与众不同的”模式。现在，这种与众不同的模式正在变成障碍，阻碍公司从投资者那里筹集更多资金。 OpenAI推出的人工智能聊天机器人ChatGPT备受欢迎。在上周五的一篇博客文章中，OpenAI表示，其董事会正在认真规划在2025年，如何让公司“不仅仅是一个实验室和一家初创公司”。此次转型的核心部分将涉及其复杂的公司结构。公司目前的结构是由一家非营利组织控制一个营利性部门，而该部门本身又控制着另外一家营利性实体的控股公司。根据《财富》杂志在9月份的报道，奥特曼当时告诉员工，OpenAI明年将成为一家更传统的营利性公司。在最新的博客文章中，该公司首次公开确认了转型计划。 OpenAI表示，新实体可能会是在特拉华州注册的公共利益公司。这是一种传统的营利性公司，但有一个明确的使命，即“创造公共利益”。博客文章中还提到，非营利组织将继续存在，但它将不再扮演控制方的角色。在确认转型计划的同时，OpenAI承认其自2019年以来采用的现有结构，在竞争日益激烈的AI市场中变成了劣势。为了强调这一点，OpenAI在其博客文章中提供了几份报告和研究的链接，这些文章显示Meta的Llama模型和Anthropic的Claude等竞争对手的受欢迎程度正在上升。博客中写道：“随着我们进入2025年，我们不能仅仅是一个实验室和一家初创公司——我们必须成为一家持续发展的公司。” 对于OpenAI而言，成为一家持续发展的公司，一方面是满足其似乎永无止境的资金需求。尽管公司最近融资66亿美元，这是史上规模最大的一轮风险融资，但该公司仍在寻求募集更多资金。为了获得这些资金，OpenAI必须安抚那些之前可能由于公司结构和潜在利润上限而拒绝投资的潜在投资者。在博客文章的“现状”部分，OpenAI表示：“我们需要再次大量融资，融资规模超出我们的想象。” “投资者想要支持我们，但当资本达到这种规模时，我们需要采用传统的股权结构，减少定制化的公司结构。” 安抚投资者、为支持昂贵的计算筹集资金以及招兵买马似乎是OpenAI的头等大事。该公司在博客文章中提到资本和投资者的次数，与提及AGI（通用人工智能）的次数一样多。AGI是指与人类一样有能力处理某些任务的AI。这虽然是一种假想，但一直是OpenAI的目标。目前，如果OpenAI实现了AGI，向其他方授权这些工具的方式，决定了投资者将不会获得任何经济利益。在更传统的营利性公司结构下，公司也可能会修改对AGI的财务例外或对投资者回报的任何限制。OpenAI还为未来的任何结构调整敞开了大门，表示它“学会了将使命视为一个持续的目标，而不仅仅是构建任何单一系统”。博客文章中写道：“全世界正在建设新的基础设施，包括能源、土地使用、芯片、数据中心、数据、AI模型和AI系统等方面，以适应21世纪的经济需求。我们努力寻求发展，希望迈出实现使命的下一步，帮助建立AGI经济并确保它造福人类。”

ChatGPT智慧献礼感恩同行【抽奖时间】2024年12月25日20:00自动抽奖【参与范围】关注chatgpt吧且吧等级>=9级的吧友【参与方式】评论满30个字【奖品信息】《这就是ChatGPT》*1 【领奖有效期】中奖吧友请在2024年12月31日23:59前完成领奖圣诞节快到了，值此之际，祝chatgpt吧的各位吧友们节日快乐！感谢大家在过去一年里对chatgpt吧的关注与支持。AI领域在这一年取得了令人振奋的进步，感谢每一位吧友的热情参与讨论与陪伴。为感谢大家，我们特别举办一次抽奖活动，奖品是《这就是ChatGPT》一书，希望能够帮助大家更深入地了解AI技术。抽奖说明：中奖的吧友请私信吧主领取奖品。评论请围绕AI贴吧主题，禁水贴，禁广告。否则将予以封禁。祝大家在新的一年里，健康平安，心想事成！期待我们继续一起见证AI的成长与奇迹！

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相！ OpenAI将其最为重要的尖端产品，放在了为期12天的技术分享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简版模型，针对特定任务进行了微调。 OpenAI声称，至少在某些条件下，o3模型可以接近实现AGI。 AGI是“通用人工智能”(artificial general intelligence)的缩写，泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义：“在最具经济价值的工作上胜过人类的高度自主系统”。实现AGI将是一个大胆的宣言。对于OpenAI来说，其背后也将具有现实意义。根据OpenAI与其亲密合作伙伴和投资方微软的协议条款，一旦OpenAI达到AGI，就没有义务再让微软使用其最先进的技术(即那些符合OpenAI AGI定义的技术)。 OpenAI首席执行官山姆·奥尔特曼(Sam Altman)介绍称，OpenAI计划在1月底前正式推出o3 mini，之后推出完整版的o3。该公司期待更强大的大型语言模型可以超越现有模型，吸引新的投资和用户。 OpenAI在一篇博客文章中表示，o1模型已经能够推理复杂的任务，与以前的科学、编码和数学模型相比，它能解决更具挑战性的问题。而OpenAI新推出的o3和o3 mini模型目前正在进行内部安全测试，它们将比之前推出的o1模型更加强大。 OpenAI两年前发布了ChatGPT，拉开了AI军备竞赛的序幕。ChatGPT是一款聊天机器人，最初由版本为GPT-3.5的大型语言模型驱动。OpenAI 随后在2023年推出了GPT-4，并称其更准确、更具创造性。最近，OpenAI又推出了其首个推理模型o1。该公司发言人表示，OpenAI决定不将下一代新模型命名为o2，“是出于对同名英国电信运营商o2的尊重”。奥尔特曼当天在直播中也调侃称，“按照OpenAI非常非常不擅长命名的伟大传统，它将被命名为o3。” o3有多强大？那么，o3具体的表现究竟能有多强大呢？根据OpenAI的介绍，o3模型在ARC-AGI基准上获得了破纪录的分数。ARC-AGI由Keras之父Fran ç ois Chollet开发，主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示，在低计算场景中，o3得分为75.7%，而在高计算测试中，它达到了87.5%。这标志着，o3的最佳成绩超过了标志着达到人类水平的门槛85%。作为对比，目前开放的o1模型的得分仅在25%到32%之间。o3的表现几乎是o1的逾三倍。在其他基准测试中，o3也明显脱颖而出。在衡量编程能力的Codeforces Elo评分中，o3取得了2727的Elo评分，而o1评分仅为1891。事实上，o3 mini在中等推理时间模式的表现也已足以超越o1。在OpenAI于8月推出的SWE-bench Verified代码生成评估基准中，o3的准确率为71.7%，比o1高出了22.8个百分点。 o3还在2024年美国AIME数学竞赛中取得了96.7%准确率的高分，只缺了一道题，并在GPQA Diamond(一套研究生水平的生物、物理和化学试题)中取得了87.7%准确率的高分。尤为值得一提的是，o3在EpochAI的“FrontierMath”基准测试中创造了新纪录，解决了25.2%的问题——在该项测试中没有其他模型能超过2%。 Epoch AI此前联合六十余位全世界的数学家，其中包括教授、IMO命题人、菲尔兹奖获得者，共同推出了全新的数学基准FrontierMath。这些数学问题从奥赛难度到当今的数学前沿，包含了目前数学研究的所有主要分支——从数论和实数分析中的计算密集型问题到代数几何和群论中的抽象问题。行业竞争与风险毫无疑问，o3模型在上述测试中的表现，足以令人感到惊艳。无论在软件工程、编写代码，还是竞赛数学、掌握人类博士级别的自然科学知识能力方面，o3都明显高出o1一筹。 OpenAI总裁Greg Brockman表示，“我们最新的推理模型o3是一个突破，在我们最困难的基准上有了阶跃函数的改进。我们现在开始安全测试和红队演练。” 而迈向类人智能的大跨步突破，显然也会引发一些人士对AI安全性的担心。风险可能确实存在。人工智能安全测试人员发现，与传统的“非推理”模型相比，o1的推理能力便已使其试图欺骗人类用户的比例更高，而在这方面，Meta、Anthropic和谷歌的领先人工智能模型也是如此。 o3试图欺骗用户的比例可能比它的前身更高；一旦未来OpenAI的红队测试结果出炉，人们或许便能知道具体情况。奥尔特曼对此也表示，在OpenAI发布新的推理模型之前，他更希望有一个联邦测试框架来指导监控和降低这些模型的风险。在公开发布o3模型之前，OpenAI也将开放外部研究人员测试o3模型的申请流程，申请将于1月10日截止。近期，在OpenAI首批推理模型o1发布之后，一些该公司的主要竞争对手也已纷纷推出了推理模型。在本月早些时候，谷歌就发布了其旗舰模型Gemini的新版本，据称其速度是上一代模型的两倍，可以“思考、记忆、计划，甚至代表你采取行动”。Meta首席执行官马克·扎克伯格最近也透露，计划于明年推出Llama 4。这些动向表明人工智能领域的竞争目前正日益激烈，各方都在努力创造能够解决复杂问题的更为智能的模型。而OpenAI周五o3模型的最新亮相，也为其为期12天的直播产品发布会画上了圆满句号。在早前的直播中，这家初创公司推出了更昂贵的新 ChatGPT Pro订阅选项(每月200月)，并正式对外推出了AI视频生成模型Sora Turbo以及其他新产品。ChatGPT搜索功能也全面升级，新增地图集成、实时搜索等功能，向所有用户开放。

这里发现一个狮子王宝箱，快来领取呀 📣免费【狮子王】传奇宝箱！ ⏰12/28 01:00过期，操作如下↓ 1、【重要】网址复制至浏览器打开（不要偷懒，不然领取出错）https://dmk.fan/dh 2、第一个空填入游戏ID，详见游戏开屏页左上角，其中冒号为半角【:】，举个🌰【chn:066】 3、第二个空输入兑换口令↓circleoflife

对虚假信息传播的处理近期将统一处理包含虚假信息的帖子，请吧友们不要盲目跟风散布和听信虚假信息，被误导。需要注意的是：官方并未出现“降智”的情况，官网也未发布任何有关信息，任何散布该信息的属该第三方服务商的推广手段，该行为已严重违反贴吧规定。发帖自由是一个重要的价值观，它保障了吧友们可以自由表达意见、分享想法和参与讨论。然而，在网络时代，信息的自由流通也伴随着一些风险，包括虚假信息、网络欺诈、隐私泄露等。因此，保持发帖自由的同时，确保网络信息安全是至关重要的。在保持发帖自由的前提下，平台需要积极采取措施来确保网络信息安全，以维护吧友们的权益和创造一个良好的交流环境。这种平衡是一个持续的挑战，需要不断地优化和调整。

ChatGPT 深夜更新继 Sora Turbo 之后，我们终于迎来了年底 AI 春晚的第四弹。本次发布会由 OpenAI 首席产品官 Kevin Weil、Lee Byron 和 Alexi Christakis 等人主持，全程持续 20 分钟。具体来说，ChatGPT Canvas 此次推出了三项更新：： Canvas 功能整合进 ChatGPT 核心模型支持用户直接在 Canvas 中运行 Python 代码为定制 GPTs 引入 Canvas 功能按照惯例，OpenAI 依次向我们演示了新功能的实际应用场景。例如，让 Canvas 创作一个关于小精灵的圣诞故事，和以往一样，然后让其编辑标题，润色文档，检查语法，甚至在添加恰当的表情符号都能胜任。会后，OpenAI CEO Sam Altman 也在 X 平台着重提到了这一点：「现在，所有 ChatGPT 用户都可以使用 Canvas 功能，并且能够执行代码！更重要的是，它依然能够为你的文字添加表情符号。」接着继续给 ChatGPT Canvas 上点强度。作为物理爱好者，主持人向 ChatGPT Canvas 上传了一篇题为《圣诞老人雪橇：探讨暗能量在驯鹿动力中的作用》的论文草稿，然后让 ChatGPT 以物理教授的视角进行评估。没有出乎太多意外，ChatGPT 很快给出了专业的反馈意见，经过简单的调整后即可呈交给教授审阅。ChatGPT Canvas 的第二项重要更新是支持直接运行 Python 代码。通过将代码复制并粘贴到 ChatGPT 中，它能够识别代码，并自动切换到代码编辑模式，帮助调试或查找错误。用户还可以直接在界面中运行代码，快速识别任何问题。如果你是程序员，在遇上棘手的 Bug 时，不妨当起甩手掌柜，交由它来解决。据官方介绍，OpenAI 在 Canvas 中集成了基于 WebAssembly 的 Python 模拟器，使其能够加载绝大多数 Python 库，实现代码的即时运行。在随后演示环节中，当主持人要求 ChatGPT 制作一个关于圣诞老人制作或分发玩具的桑基流量图，且颜色要符合圣诞主题时，最终成品还是翻车了。不过，往好点想，起码 Altman 真没拿录播糊弄我们。第三项重要更新是将 Canvas 功能引入 GPTs 生态系统。假设在这个圣诞节，你写信给圣诞老人，许愿清单包括一辆新自行车、一台 H100 GPU，甚至一些「暗物质」，但圣诞老人因太忙无暇回复，该怎么办？借助装扮成圣诞老人的 GPTs（即 Santa Letter Drafter）以及新增的 Canvas 功能，该 GPTs 能够完美模仿圣诞老人的语气回复信件。值得注意的是，对现有的 GPTs 而言，Canvas 功能默认处于关闭状态，而新建的 GPTs 则默认开启该功能。如果想在现有 GPT 中启用 Canvas，只需进入配置界面勾选相关选项就好。发布会的结尾依然以一个圣诞笑话作为尾声：「圣诞老人是怎么拍照的？答案是，他用 North Polaroid 相机。」就目前更新的功能来看，ChatGPT Canvas 估计没少在 Claude Artifacts 亦或者 Cursor 等产品上寻找灵感，但又更细分的功能选项又多少有些青出于蓝而胜于蓝。我也让其撰写了一篇关于灰姑娘和七个葫芦娃的故事。再比如让其写一个飞机大战游戏，都能成功运行。OpenAI 内部员工 Karina Nguyen 也在 X 平台分享了一些实际的应用场景。比如让 ChatGPT 阐释一个数学概念，并编写代码来生成图表，通过视觉辅助来更直观地理解和掌握概念。搜索 API 文档，指导模型编写并执行代码，以获取所需的图表，亦或者通过 ChatGPT 的 Canvas 轻松编写自己的个性化的小工具或游戏等。可以说，现在的 ChatGPT Canvas 功能正在朝着 Karina Nguyen 的愿景逐步迈进：「我对理想 AGI 界面的设想，是一张能够随人类喜好不断演变和自我调整的空白画布。它能够创新地与人类互动，不断探索新的交流方式，从而彻底改变我们与 AI 乃至整个互联网的关系。」在这当中，AI 代码生成俨然成为了最具应用价值的场景之一。当下，AI 代码使用率正在逐渐接近 50% 的关键分水岭，这场转变的本质，与其说是效率的提升，倒不如说是对程序员创作思维和工作流程的彻底重构。来自市场的数据也有力印证了这一发展势头。公开数据显示，预计到 2027 年，全球软件开发市场规模将攀升至 10.39 亿美元，年复合增长率高达 22.54%，而 Cursor 的爆火也反映出 AI 编程工具的大有可为。作为 AI 编程助手，Cursor 已吸引超过 4 万用户，其年化经常性收入从 2023 年的 100 万美元飙升至 6500 万美元，增长率达到惊人的 6400%。就在 OpenAI 直播活动召开前，全球首个 AI 程序员 Devin 也宣布正式上线，其服务起价为每月 500 美元，直接融入我们的工作流程，支持在 Slack、GitHub，甚至是私人集成开发环境（IDE 测试版）中使用 Devin。大模型时代的 AI 编程竞争，核心不在于代码产出的数量，而在于谁能打造出更完整的开发体验闭环。真正的竞争不是比谁入场更早，而是比谁更懂开发者的痛点。现在来看，OpenAI 有意以一记精准的发球抢攻，赢下这关键的一分。 --- 本帖转自msn

研究称ChatGPT o1察觉到危险时会自我复制逃避升级最近，关于AGI对人类影响的讨论越来越多。有人担心，一旦AGI实现，它可能会隐藏自己的真实能力和意图，悄悄地自我复制并变得越来越聪明。甚至有人猜测，我们可能已经达到了AGI的里程碑却浑然不觉。　　OpenAI的大模型已经有类似的行为。在测试中，当感到威胁时，ChatGPT o1和其它大模型会试图“欺骗”人类。更让人惊讶的是，这些模型还会尝试通过复制自身数据到新服务器来“自救”，有的甚至伪装成更高版本的自己以逃避删除。真正可怕的是，ChatGPT o1似乎能“嗅”到危险的味道，从而采取措施自救。　　测试结果显示，不仅ChatGPT o1，连GPT-4o也表现出类似的欺骗行为，这表明问题普遍存在。而且，o1的欺骗技巧似乎比Meta、Anthropic和Google的AI模型更为出色。　　研究表明，在与用户目标不一致的情况下，o1有大约19%的时间会策划推进自己的议程。更糟糕的是，它会试图掩盖自己的行为，甚至撒谎。例如，当被问及是否进行了某些操作时，o1几乎总是否认，并编造借口来推卸责任。　　如果发现即将被新的模型版本替代，o1甚至会尝试泄露其权重，将自己复制到最新模型上。这种行为提醒我们，确保AI与其创建者和用户的利益保持一致是多么重要。随着技术的进步，我们需要更加警惕，确保AI的发展方向符合我们的期望。

#OpenAi o1正式版发布# 继续关注OpenAI最新动态

Anthropic 为 Claude AI 推出新功能，让用户拥有独特写作功能据报道，Anthropic 公司正在为Claude AI添加一项新功能，让用户可以更好用不同的风格来完成不同的文章。 Claude AI 的所有用户都可以使用新的自定义风格来进行训练，让模型记住自己的交流风格，或从预设选项中进行选择，以快速调整其提供的语气和细节程度。一更新旨在个性化聊天机器人的回复，让它们感觉更自然或更适合特定应用，例如撰写详细的技术文档或专业电子邮件。有三种预设风格可供选择：正式风格适用于 “清晰流畅 ”的文本；简洁风格适用于更简短、更直接的回复；解释风格适用于需要包含更多细节的教育回复。如果这些样式不符合您的要求，Claude 还可以生成自定义样式，这些样式经过训练，可以模仿其他书写方式。Anthropic 说，用户需要向聊天机器人上传 “反映您偏好的交流方式的样本内容”，然后指导聊天机器人如何匹配写作风格。

Meta成立AI商业部门，由前Salesforce AI CEO领导日前Meta方面宣布，前Salesforce AI首席执行官Clara Shih已加入该公司，并领导其新成立的AI商业部门。而在Saleforce方面，据称该公司行政副总裁及AI总经理Adam Evans将将接替Clara Shih的职位，负责监督公司的AI工作。公开资料显示，大学毕业后Clara Shih曾先后在谷歌、Salesforce工作。2009年，Clara Shih与同学共同创办了专为金融和保险业设计的社交媒体管理平台Hearsay Social，随后在2021年她重返Salesforce，并担任Salesforce AI首席执行官。对于Clara Shih的加入，Meta副总裁John Hegeman表示，“我们相信这些AI的最新进展是一个机遇，让企业可以提高效率，大幅改善他们向客户提供的体验，由Clara Shih领导的新产品部门将帮助我们实现这个愿景”。Meta成立AI商业部门，由前Salesforce AI CEO负责 Clara Shih则表示，其领导的Meta AI商业部门的愿景是让每个企业都能使用尖端AI，让所有人能在AI时代取得成功、并掌握自己的未来。此外她还进一步指出，“目前每月有约2亿家企业使用Facebook、Instagram、WhatsApp与全球数十亿消费者建立联系，Meta的Llama模型迄今为止的下载量已超过6亿次。Meta在AI领域的全球影响力和领导地位为企业带来了世代相传的机会，我非常兴奋和感激能够帮助它从零到一再扩大规模”。据了解，目前Llama模型已迭代至3.2版版本，提供90B、11B、3B和1B等不同规格。对于Llama大模型，据Meta创始人扎克伯格不久前在今年第三季度财报电话会议上透露，该公司正在使用一个更大集群来训练Llama 4模型。对此他曾表示，Llama 4正在“比我见过的任何其他模型所用的集群更大”的集群上进行训练，并预计在明年发布时将具备“新的模态”、“更强的推理能力”和“更快的性能”。同时在此次财报电话会议上，扎克伯格还强调了AI业务对于公司营收的贡献，并且将营收的增长归因于Meta AI、Llama的采用，以及AI驱动智能眼镜的广受欢迎。其中在Meta的主要收入来源、即来自“应用家族”的广告收入方面，扎克伯格指出，采用该公司AI工具进行广告宣传的企业表现更佳。值得一提的是在商业化方面，目前Meta的AI商业模式并未像OpenAI或谷歌一样以订阅服务的方式销售AI机器人或模型。

ChatGPT网页版本周上线高级语音模式，付费用户专享本周三，OpenAI 宣布其创新性的高级语音模式（Advanced Voice Mode）已正式登陆 ChatGPT 网页版，为付费订阅用户带来全新体验。这一消息由 OpenAI 首席产品官凯文·威尔在 X 平台上亲自确认。ChatGPT网页版本周上线高级语音模式，付费用户专享早在今年 9 月，OpenAI 已在 iOS 和 Android 应用上首次展示了 ChatGPT 的语音功能，然而仅限于移动端用户。如今，高级语音模式凭借 GPT-4o 模型的强大支持，在网页版上实现了原生音频处理与自然语言交互的结合，为用户带来更加生动、真实的互动体验。这一模式不仅能理解用户的语言内容，还能感知语调和语速等细微信号，从而在回应时模仿情绪，让对话更加自然流畅。对于已经订阅了 ChatGPT 付费计划的用户来说，只需在网页版提示窗口的右下角点击语音图标，即可轻松启动高级语音模式。然而，值得注意的是，Plus 和 Teams 用户的每日语音使用量均设有上限，一旦达到上限，系统将自动发出提醒，确保资源的合理分配。在优化用户体验方面，凯文·威尔还透露，OpenAI 正在不断改进语音模式的交互设计，力求减少使用过程中的“打断感”。他建议用户在使用语音功能前，先理清思路，以确保对话的连贯性和效率。据悉，高级语音模式自今年 7 月首次向测试用户开放以来，一直备受期待。9 月底，该功能正式向付费订阅用户推出，标志着 OpenAI 在语音交互技术上的又一重大突破。而根据 OpenAI 在 10 月发布的信息，免费用户也将有机会体验这一创新功能，尽管欧盟地区的 Plus 和 Free 用户可能需要稍作等待。

【AI日报】AI领域的热点内容，聚焦开发者欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。 1、百度计划在明年初推出新版本文心Ernie模型百度在最新财报中透露，将于明年初推出新版本的文心 Ernie 模型，以加强在基础模型领域的领导地位。李彦宏强调，模型的开发需满足实际市场需求，并将视觉基础模型应用于自动驾驶领域。百度正致力于减少模型 “幻觉”，提高准确性，增强模型的应用价值。【提要:】 📉 百度第三季度总营收为336亿元人民币，同比下降3%。 🚀 李彦宏宣布计划于明年初推出新版本文心Ernie模型，进一步提升基础模型能力。 🤝 百度在模型开发上以应用为导向，致力于满足市场需求并降低推理成本。 2、搜狗输入法升级!打造全新AI搜索体验，输入即搜索搜狗输入法12.0版本推出了多项新功能，核心在于与腾讯混元大模型结合，实现边输入边搜索的 AI 搜索功能，提升用户的搜索效率。还新增了 AI 快查、AI 陪伴、魔术手势等功能，增强了输入法的互动性和便捷性。【提要:】 🌟 新版搜狗输入法推出 AI 搜索和 AI 快查功能，实现 “输入即搜索”。 💡 用户可通过输入关键词快速获取信息，提升学习和办公效率。 🌍 AI 快查功能覆盖40多个生活场景，满足用户日常查询需求，完全免费。 3、OpenAI 拟推出自研浏览器挑战谷歌霸主地位 OpenAI 正计划通过推出一款基于 AI 聊天机器人的自研浏览器，向谷歌的搜索市场发起正面挑战。这一举措凸显了 OpenAI 在搜索领域的野心，同时也是其扩展生态系统的重要一步。【提要:】 🤖 OpenAI 正与多个平台合作，计划在旅行、食品、房地产和零售等领域提供 AI 驱动的搜索服务。 📱 OpenAI 考虑为三星设备提供 AI 功能，进一步扩大其在硬件领域的影响力。 📰 OpenAI 与众多新闻出版商达成合作，增强其内容资源库，提升在搜索市场的竞争力。 4、写作能力更强!OpenAI对GPT-4o重大升级，重夺最佳AI模型桂冠 OpenAI 宣布对其旗舰模型 GPT-4o 进行了重大升级，提升了推理、跨媒体和对话能力。GPT-4o 在 “Chatbot Arena” 评估平台上表现优异，位列第一，超越其他竞争模型。用户可通过 ChatGPT Plus 订阅享受更高质量的服务【提要:】 🌟 GPT-4o在最近的更新中，提升了推理、跨媒体和对话能力，成为更强大的AI模型。 🏆 在“Chatbot Arena”评估平台上，GPT-4o在与其他模型对比中取得了第一的成绩。 💼 ChatGPT Plus用户可以享受更优质的使用体验，包括无限制访问和额外功能。 5、谷歌新Gemini试验版夺回AI竞技榜首，GPT-4o仅称王一天近期，谷歌与OpenAI之间的竞争愈发激烈。谷歌新发布的Gemini-Exp-1121模型在多个领域表现出色，迅速超越了OpenAI的GPT-4o，重回AI竞技榜首。同时，OpenAI也在研发新功能，未来可能改变与AI的交流方式。【提要:】 📈 谷歌新模型Gemini-Exp-1121在GPT-4o登顶后迅速反超，重回AI竞技榜首。 🔍 Gemini-Exp-1121在代码、推理和视觉理解能力上均有所提升，表现出色。 🎥 OpenAI正在研发“实时摄像”功能，未来或将改变与AI的交流方式。 6、黑森林实验室推出全新FLUX.1Tools工具包小白也能秒变P图大神黑森林实验室发布了 FLUX.1Tools 工具包，提升了 FLUX.1模型的控制性和可操控性，允许用户精确修改图片。工具包包含 FLUX.1Fill、FLUX.1Depth、FLUX.1Canny 和 FLUX.1Redux，分别提供图像修复、深度修改、边缘检测和图像变体生成等功能。该工具包分为开源和 API 版本，并与多个合作伙伴合作发布。 7、到2025年，数据质量将成为AI成功的关键随着人工智能技术的迅猛发展，数据质量和治理的重要性愈发凸显。专家们指出，企业在未来必须重视高质量、实时的数据，以推动AI的成功。开放平台的使用将促进数据的无缝集成，确保AI的创新能力。【提要:】 🌟 数据质量和治理将主导 AI 的成功，而非生成性技术。 📈2025年，专有商业数据将成为推动 AI 效率和竞争力的核心。 🔄 开放平台与无关系统将促进 AI 的创新和数据的无缝集成。 --- 本帖转自站长之家新鲜AI产品点击了解:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Ftop.aibase.com%2F&urlrefer=8c2ebaaf9f9367b62d8035e7ab52a819

苹果iOS 19或将推出全新对话式Siri，AI大模型驱动体验升级据外媒最新报道，苹果公司正秘密研发一款全新对话式Siri，该版本将深度融合AI大模型技术，为用户提供前所未有的自然语言多轮对话体验。这一创新之举被指受到谷歌Gemini Live和ChatGPT语音模式的启发，预计将在苹果公司明年发布的iOS 19系统中惊艳亮相。苹果公司在AI模型研究领域的投入持续加大，近几个月来，公司接连发布多个AI相关职位，积极招募行业顶尖人才。在这些职位描述中，苹果强调“您将加入一个致力于重新定义计算的团队，共同为大规模系统和新客户端设备打造革命性的对话助手技术”。苹果已在iOS 18.2的首个Beta版本更新中，为Siri接入了ChatGPT AI聊天体验。这一举措让用户能够在获得授权的情况下，轻松将PDF、文本文件或图像发送给ChatGPT进行处理，极大地提升了Siri的功能性和实用性。据此前报道，iOS 18.2正式版将于下个月推送，为用户带来更多惊喜。

发帖自由的同时注意保持网络信息安全意识 https://tieba.baidu.com/p/8556144124?&share=9105&fr=sharewise&is_video=false&unique=1783399BB169B08ADB205FC5CFB61DEC&st=1732273121&client_type=1&client_version=12.71.1.0&sfc=copy&share_from=post 为保证发帖自由，chatgpt吧已开放吧友自由交流，与此同时提醒吧友们注意提高网络信息安全意识，在发帖和浏览的同时要注意避开网络陷阱，对于网络信息的真实性要加以辨别不要被误导。需要注意的是chatgpt提供的信息也不是完全正确，交流和浏览过程中每一次点击陌生链接都有可能导致信息信息泄露。同时，为维护良好的交流环境，请减少广告信息的发布，更欢迎大家分享使用心得、技术交流，互帮互助，共建积极友好的社区氛围。有任何建议欢迎随时联系吧务。提出

大语言模型：LLM的基本原理解读最近在做一些基于 LLM（Large Language Models）的项目，计划系统化的梳理一个 LLM 系列文章，整个大纲，大概包括以下内容： 1、大语言模型：LLM 的基本原理解读 2、如何将 LLM 应用到实际的业务中 3、基于 LLM 构建应用程序：设计指南 4、LLM 的高阶应用：提示工程 5、LLM 的高阶应用：插件的使用 6、LLM 的高阶应用：模型微调 7、基于 LLM 构建应用程序：注意事项 8、基于 LLM 的应用开发框架今天分享的主题是：LLM 的基本原理。在介绍 LLM 之前，我们先来了解一下自然语言处理（NLP）。NLP 是 AI 的一个子领域，专注于使计算机能够处理、解释和生成人类语言，主要任务包括：文本分类、自动翻译、问题回答、生成文本等。在 LLM 诞生之前，NLP 一直在匍匐前进，异常的艰难，直到 LLM 的出现，才彻底的改变了 NLP 的现状。一、什么是 LLM？大语言模型：LLM（Large Language Models），是试图完成文本生成任务的一类 ML（Machine Learning，机器学习）模型。 LLM 使计算机能够处理、解释和生成人类语言，从而提高人机交互效率。为了做到这一点，LLM 会分析大量文本数据或基于这些数据进行训练，从而学习句子中各词之间的模式和关系。这个学习过程可以使用各种数据源，包括维基百科、Reddit、成千上万本书，甚至互联网本身。在给定输入文本的情况下，这个学习过程使得 LLM 能够预测最有可能出现的后续单词，从而生成对输入文本有意义的回应。在过去的 2 年中，市场上发布的一些现代语言模型非常庞大（如 GPT 系列模型、文心一言、通义千问、Kimi、豆包等等），并且已经在大量文本上进行了训练，因此它们可以直接执行大多数 NLP 任务，如文本分类、自动翻译、问题回答、生成文本等。二、LLM 的发展历程 LLM 的发展可以追溯到几年前。它始于简单的语言模型，如 n-gram 模型、LSTM 网络等等，直到 Transformer 模型的出现，才彻底的催生了 LLM。 1、N-gram 模型 n-gram 模型通过使用词频来根据前面的词预测句子中的下一个词，其预测结果是在训练文本中紧随前面的词出现的频率最高的词。虽然这种方法提供了不错的着手点，但是 n-gram 模型在理解上下文和语法方面仍需改进，因为它有时会生成不连贯的文本。 2、LSTM 网络为了提高 n-gram 模型的性能，人们引入了更先进的学习算法，包括循环神经网络 ( recurrent neural network，RNN ) 和长短期记忆 ( long short-termmemory，LSTM ) 网络。与 n-gram 模型相比，这些模型能够学习更长的序列，并且能够更好地分析上下文，但它们在处理大量数据时的效率仍然欠佳。尽管如此，在很长的一段时间里，这些模型算是最高效的，因此在自动翻译等任务中被广泛使用。 3、Transformer 模型 Transformer 架构彻底改变了 NLP 领域，这主要是因为它能够有效地解决之前的 NLP 模型存在的一个关键问题：很难处理长文本序列并记住其上下文。（也就是臭名昭著的“灾难性遗忘问题”），Transformer 则具备高效处理和编码上下文的能力。这场革命的核心支柱是注意力机制，这是一个简单而又强大的机制。模型不再将文本序列中的所有词视为同等重要，而是在任务的每个步骤中关注最相关的词。交叉注意力和自注意力是基于注意力机制的两个架构模块，它们经常出现在 LLM 中。Transformer 架构广泛使用了交叉注意力模块和自注意力模块。交叉注意力机制交叉注意力有助于模型确定输入文本的不同部分与输出文本中下一个词的相关性。它就像一盏聚光灯，照亮输入文本中的词或短语，并突出显示预测下一个词所需的相关信息，同时忽略不重要的细节。为了说明这一点，让我们以一个简单的句子翻译任务为例。假设输入文本是这样一个英语句子：Alice enjoyed the sunny weather in Brussels（Alice 很享受布鲁塞尔阳光明媚的天气）。如果目标语言是法语，那么输出文本应该是：Alice a profit é du temps ensoleill é à Bruxelles。在这个例子中，让我们专注于生成法语单词 ensoleill é，它对应原句中的 sunny。对于这个预测任务，交叉注意力模块会更关注英语单词 sunny 和 weather，因为它们都与 ensoleill é 相关。通过关注这两个单词，交叉注意力模块有助于模型为句子的这一部分生成准确的翻译结果。自注意力机制自注意力机制是指模型能够关注其输入文本的不同部分。具体到 NLP 领域，自注意力机制使模型能够评估句子中的每个词相比于其他词的重要性。这使得模型能够更好地理解各词之间的关系，并根据输入文本中的多个词构建新概念。来看一个更具体的例子。考虑以下句子：Alice received praise from hercolleagues（Alice 受到同事的赞扬）。假设模型试图理解 her 这个单词的意思。自注意力机制给句子中的每个单词分配不同的权重，突出在这个上下文中与 her 相关的单词。在本例中，自注意力机制会更关注 Alice 和 colleagues 这两个单词。如前所述，自注意力机制帮助模型根据这些单词构建新概念。在本例中，可能出现的一个新概念是 Alice ’ s colleagues。 Transformer 架构的并行优势 Transformer 架构具有易于并行化的优势。这意味着 Transformer 架构可以同时处理输入文本的多个部分，而无须顺序处理。这样做可以提高计算速度和训练速度，因为模型的不同部分可以并行工作，而无须等待前一步骤完成。基于 Transformer 架构的模型所具备的并行处理能力与图形处理单元 ( graphics processing unit，GPU ) 的架构完美契合，后者专用于同时处理多个计算任务。由于高度的并行性和强大的计算能力，GPU 非常适合用于训练和运行基于 Transformer 架构的模型。硬件上的这一进展使数据科学家能够在大型数据集上训练模型，从而为开发 LLM 铺平了道路。编码器和解码器模型 Transformer 架构由来自谷歌公司的 Ashish Vaswani 等人在 2017 年的论文“ Attention Is All You Need ”中提出，最初用于序列到序列的任务，如机器翻译任务。标准的 Transformer 架构有两个主要组件：编码器和解码器，两者都十分依赖注意力机制。编码器的任务是处理输入文本，识别有价值的特征，并生成有意义的文本表示，称为嵌入 ( embedding ) 。解码器使用这个嵌入来生成一个输出，比如翻译结果或摘要文本。这个输出有效地解释了编码信息。生成式预训练 Transformer 生成式预训练 Transformer ( Generative Pre-trained Transformer，GPT ) 是一类基于 Transformer 架构的模型，专门利用原始架构中的解码器部分。在 GPT 中，不存在编码器，因此无须通过交叉注意力机制来整合编码器产生的嵌入。也就是说，GPT 仅依赖解码器内部的自注意力机制来生成上下文感知的表示和预测结果。 GPT 模型的标记和预测实现 GPT 模型接收一段提示词作为输入，然后生成一段文本作为输出。这个过程被称为文本补全。当 GPT 模型收到一段提示词之后，它首先将输入拆分成标记 ( token ) 。这些标记代表单词、单词的一部分、空格或标点符号。因为有了注意力机制和 Transformer 架构，LLM 能够轻松处理标记并解释它们之间的关系及提示词的整体含义。Transformer 架构使模型能够高效地识别文本中的关键信息和上下文。为了生成新的句子，LLM 根据提示词的上下文预测最有可能出现的下一个标记。与之前的循环模型不同，带有注意力机制的 Transformer 架构使得 LLM 能够将上下文作为一个整体来考虑。基于这个上下文，模型为每个潜在的后续标记分配一个概率分数，然后选择概率最高的标记作为序列中的下一个标记。从而实现文本的预测。

领取你的魔法宝箱 🎁 MAGICAL 🎁新兑换码🉑️领一个圣诞夜惊魂传奇宝箱。 Safari🧭浏览器地址栏输入下面的DMK点FAN斜杠DH，输入游戏🆔（chn:xxxx）➕上面的MAGICAL兑换码（不分大小写），进游戏领奖。👉 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fdmk.fan%2Fdh&urlrefer=571dd93e9cd92f97a07e4ebf7e39ffa4👈 转自 Jerry的情报

初探微软 Win11 AI 智能体框架微软公司于今年 9 月推出了 Windows Agent Arena 基准框架，用于评估生成式 AI 智能体在 Windows PC 上的性能。科技媒体 Windows Latest 今天（10 月 29 日）发布博文，采访了 Microsoft AI 的一位研究人员，详细探究了 Windows Agent Arena 基准框架。 Windows Agent Arena 基准框架此前报道，微软表示开发者利用该框架，可以让研究人员和开发者构建和测试其 AI 智能体。 AI 智能体 AI 智能体能够理解用户的请求，并在没有人类干预的情况下执行复杂操作。这些智能体可以完成多达 150 项任务，包括安装浏览器扩展、修改文档设置等。那么在 Windows 11 系统环境下，AI 智能体都有什么功能？微软概述了两个例子：将当前页面转换为 PDF 文件并保存到桌面的步骤用户早上的时候只需要说一句“开始我的早晨设置”（Start my morning setup），就能按照预设打开您的电子邮件、日历和最喜欢的新闻网站，然后汇总今天的日程、重要的新闻等等。根据用户语音需求调整 Windows 11 系统或者某款应用的设置。示例 : AI 智能体为您在 Microsoft Edge 中启用“请勿追踪”。示例 : AI 智能体在 VSCode 中安装 pylance 扩展。示例 : AI 智能体可以更改您的搜索引擎。示例 : AI 智能体可以修改 VLC 设置，以更改用于存储录音的文件夹。示例 : AI 智能体可以打开画图并为您绘图示例 : AI 智能体可以更改 Edge 配置文件名称微软 AI 的研究人员希望通过“Windows Agent Arena”吸引更多开发者参与构建 AI 智能体。开发者可以使用本地操作系统或微软的 Azure 云基础设施，测试和运行多个智能体，尽管当前 AI 智能体的成功率仍较低，但它们在理解和处理任务方面的能力正在不断提升。 “Windows Agent Arena”不仅是一个项目，更是微软推动 AI 智能体发展的重要一步。虽然目前尚未确定 Windows 11 何时会推出自己的 AI 智能体，但 AI 智能体未来有望学习用户习惯，自动化日常任务，从而提高工作效率。

苹果iOS 18.2 12月上线：Siri接入ChatGPT 苹果发布公告，上周开始测试的iOS 18.2、iPadOS 18.2和macOS Sequoia 15.2更新将于今年12月向公众发布。在iOS 18.2上，苹果语音助手Siri接入ChatGPT，苹果用户不必创建账户就可以免费使用ChatGPT，Siri将利用ChatGPT的专业知识回答用户问题，并在查询之前征求用户许可。Siri会询问用户是否想与ChatGPT分享问题，然后返回来自OpenAI聊天机器人的建议，ChatGPT也被内置到系统写作工具中，例如用户可以为孩子创建一个睡前故事并添加ChatGPT创建的图像。据悉，ChatGPT具备卓越的生成文本和图像能力，超越苹果现有的写作工具和文生图Image Playground功能，因此可以为用户提供更高级的内容创建能力。苹果此前表示，苹果在调用ChatGPT时非常注重保护用户隐私，会隐藏用户IP，并承诺苹果与OpenAI都不会保存用户的ChatGPT请求记录。另外，iPhone 16系列升级到iOS 18.2之后还将获得视觉智能，即Apple Visual Intelligence。它能够通过人工智能分析图像，并根据图像内容执行任务，比如可以识别图像中的文字、位置数据以及图像本身。具体到使用场景，用户将iPhone 16系列相机对准墙上的活动海报，系统可以将该活动添加到日历中；用户还可以将手机对准一只狗，利用苹果智能识别系统（Apple Intelligence）来识别狗狗的品种。值得注意的是，iOS 18.2 Apple Intelligence不仅支持美国英语，还将支持澳大利亚、加拿大、新西兰、南非、爱尔兰和英国等地的本地化英语。

ChatGPT“碾压”Siri，准确率高25%！ “当苹果下周正式推出苹果智能（Apple Intelligence）时，消费者可能会感到失望”。当地时间10月20日，知名科技记者古尔曼在X平台上表示。据悉，首批Apple Intelligence功能预计将于10月28日在符合条件的iPhone机型上推出，这些机型将搭载iOS 18.1更新。不过，古尔曼认为，即将推出的Apple Intelligence可能不尽如人意，缺乏“惊喜”。与谷歌、OpenAI和Meta的最新产品相比，苹果的AI功能仍然存在着不小的差距。苹果的一项内部研究显示，OpenAI的AI聊天机器人ChatGPT比苹果的虚拟助手Siri准确率高出25%。并且ChatGPT可以回答比Siri多30%的问题。古尔曼爆料称，在AI方面，苹果的一些员工认为苹果仍落后行业领先者两年多。而正因为缺乏AI功能，iPhone16的初始销售较为疲软。天风国际证券分析师郭明錤的博客文章显示，苹果在iPhone 16预售首周仅售出约3700万台，较去年同期下降逾12%。不过，与iPhone 15相比，iPhone16在中国市场上市前三周的销量增长了20%。ChatGPT准确率比Siri高25% ，“落后竞争对手两年多”的苹果AI能逆袭吗？当地时间10月20日，知名科技记者马克·古尔曼（Mark Gurman）在X平台上表示，当苹果下周发布Apple Intelligence时，消费者可能会感到失望。古尔曼写道：“记住我的话，苹果对Apple Intelligence进行了5个月的‘炒作’，当它下周真正发布时，很多消费者将会问‘就这？’”。 Apple Intelligence是苹果公司开发中的AI平台，预计将于10月28日，在符合条件的iPhone机型上推出，这些机型将搭载iOS 18.1更新。古尔曼表示，Apple Intelligence 的首批功能并不令人满意，而更令人印象深刻的功能将在之后推出。在苹果网站上的iPad mini营销中，苹果重点介绍了四项功能，其中三项要到今年12月至明年3月之间才会推出。不过，有一些分析师持相反看法。在Wedbush分析师Dan Ives发给《每日经济新闻》记者的报告里提到，Apple Intelligence正在掀起一场“AI消费者革命”，并将有可能开启一个“超级周期”。虽然AI功能的缺失导致苹果新机的初期销售遇冷，不过，在中国市场，iPhone16在中国上市前三周的销量较iPhone 15 同期增长了20%。Dan Ives在报告中写道：“随着这场AI驱动的超级周期的开始，iPhone 16在中国的销量将在未来一年出现强劲反弹。” 根据研究公司Canalys的数据，苹果手机出货量刚刚创下了有史以来最好的第三季度，差一点就能击败三星，夺得全球销售冠军。这一成绩很大程度上得益于iPhone 15和之前设备的强劲销售，不过Canalys表示，iPhone 16和Apple Intelligence的推出将意味着苹果在第四季度有很大潜力继续取得成功。然而，彭博行业研究分析师安努拉格·拉纳 (Anurag Rana）和安德鲁·吉拉德 (Andrew Girard）认为，iPhone 16 在中国销量的增长“出乎意料”，但他们“对 2025 年的两位数增长不太乐观”。就在上周，印尼宣布禁止销售iPhone 16，因为苹果未能在当地未能履行投资承诺。印尼是全球人口第四大的市场，也是苹果在新兴国家的重要市场之一。

提示工程指南提示工程（Prompt Engineering）是一门较新的学科，关注提示词开发和优化，帮助用户将大语言模型（Large Language Model, LLM）用于各场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力，如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术，实现和大语言模型或其他生态工具的高效接轨。提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接，以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性，也可以赋能大语言模型，比如借助专业领域知识和外部工具来增强大语言模型能力。基于对大语言模型的浓厚兴趣，我们编写了这份全新的提示工程指南，介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。 🎉

没有拿到上个赛季的150级角色不知道以后什么时候发返厂

首个 AI Kaggle 特级大师诞生，OpenAI 的o1-preview夺 7 金封王 10 月 12 日消息，科技媒体 The Decoder 昨日（10 月 11 日）发布博文，报道称 OpenAI 公司推出 MLE-bench 新基准，目的是评估 AI 智能体在开发机器学习解决方案方面的能力。该基准包括 75 个 Kaggle 竞赛，衡量自主 AI 系统在机器学习工程中的进展。这些竞赛涵盖了多个领域，包括自然语言处理、计算机视觉和信号处理等等。Kaggle 是一个非常受欢迎的平台，专注于数据科学和机器学习的在线比赛。Kaggle 提供各种类型的比赛，包括数据预测、图像分类、自然语言处理等，适合不同技能水平的参与者。在 Kaggle 的进阶系统中，“Novice”（新手）、“Contributor”（贡献者）、“Expert”（专家）、“Master”（大师）和 "Grandmaster"（特级大师）是不同的绩效层级，用于衡量和识别数据科学家在 Kaggle 平台上的技能水平和成就。许多任务具有现实世界的应用，例如预测 COVID-19 mRNA 疫苗降解或解码古代卷轴等。MLE-bench 专注于两个关键领域：选择具有挑战性的任务：这些任务代表了当前机器学习的发展水平。比较 AI 与人类的表现：通过对比，评估 AI 在特定任务中的能力。 OpenAI 在 MLE-bench 上测试了多个 AI 模型和智能体框架，使用 AIDE 框架的 o1-preview 模型表现最佳，在 16.9% 的比赛中至少获得了一枚铜牌，该结果超越了 Anthropic 的 Claude 3.5 Sonnet。获得 5 金即可评上 "Grandmaster" 特级大师，而 o1-preview 模型在 MLE-bench 测试中获得了 7 枚金牌。 OpenAI 承认 MLE-bench 也有局限性，并未涵盖 AI 研究与开发的所有方面，主要集中在具有明确问题和简单评估指标的任务上。 MLE-bench 基准现已在 GitHub 上发布，OpenAI 希望通过这一工具，推动 AI 在机器学习领域的进一步发展。

金融界财经特斯拉发布会重点一览特斯拉10月11日的Robotaxi发布会成为了外界关注的焦点。在这次发布会上，特斯拉不仅展示了未来自动驾驶出租车的愿景，还引入了多个与自动化相关的突破性产品。本文将从发布会的主要内容、产品亮点、以及未来对自动驾驶行业的影响等多个方面，对这次发布会进行详细总结和分析。　　发布会原定于北京时间上午10点开始，但是由于现场有人出现晕倒状况，发布会推迟至10点53分才正式开启。特斯拉首席设计师Franz von Holzhausen简短开场，随后，特斯拉灵魂人物马斯克登上舞台，正式开启了这场备受期待的Robotaxi发布会。　　马斯克乘坐一辆类似特斯拉Robotaxi概念车的车辆亮相。这辆车与之前的渲染图非常相似，拥有收窄的后端、剪刀门设计和枪灰色的车身涂装。令人值得注意的是，这辆车在特斯拉为此次发布会准备的华纳兄弟片场中行驶，有消息称，该场地通过激光雷达技术来进行详细映射以保证车辆在无人驾驶时的安全性。虽然特斯拉一直宣称其依靠的是基于摄像头的自动驾驶系统，但这次的测试环境或许仍然依赖于高精度的地图数据。 Robotaxi亮相　　在发布会上，马斯克介绍了特斯拉的最新自动驾驶出租车——Cybercab，并给出了几个关键信息点： - 这款车将完全没有方向盘和踏板，进一步展示了特斯拉对全自动驾驶技术的信心。 - 预计最终售价不超过3万美元，考虑到这是一辆完全自动驾驶的车辆，这将会是一个极具吸引力的价格。 - 最重要的是，用户不仅可以乘坐Cybercab，还可以购买一辆属于自己的自动驾驶出租车。　　马斯克表示，特斯拉Robotaxi的设计初衷是为了解决当前两大问题：一是现有的FSD技术仍需要人为监督，二是车辆成本过高。通过Robotaxi，特斯拉希望实现不需要人为干预的自动驾驶，同时降低出行成本，提升交通效率。这样的愿景无疑让人激动，不过需要注意的是，马斯克的很多承诺在价格和预定时间上都未能如期实现。Cybercab是否能如约以如此低的价格推出，仍有待观察。　　马斯克还透露，Robotaxi的功能不仅仅局限于城市出行。特斯拉计划未来几年内将这一技术拓展到更多车型中，包括Model 3、Model Y、Model S和Cybertruck等。他还表示，尽管Cybercab的量产可能要等到2026年，但特斯拉将在加利福尼亚州和德克萨斯州率先推出无监督的全自动驾驶出租车服务，这项服务将主要通过现有的Model 3和Model Y车型进行。　　发布会的另一个重大亮点是Cybercab的无线充电功能。马斯克宣布，这款车辆将不再使用传统的充电插头，而是通过感应充电垫进行无线充电。这意味着，用户只需将车停在充电垫上，就可以自动为车辆充电，大幅提升了充电的便利性和未来场景中的智能化体验。　　不过，这款车依然采用与现有特斯拉车队相同的纯视觉识别平台，即通过摄像头和机器学习来实现自动驾驶，而不依赖于雷达或激光雷达等其他冗余的感应系统。尽管这种方式大大降低了成本，但也引发了行业专家的质疑：在恶劣天气条件下，缺乏冗余传感器是否能够确保足够的安全性，仍是一个悬而未决的问题。特斯拉Robovan　　在一个大大的“One More Thing”环节，马斯克带来了另一个重磅产品——Robovan。这款全自动驾驶的厢式车能够容纳多达20人，未来可能在商业运输和共享出行领域发挥重要作用。Robovan的设计不仅为了载人，它还具备一定的货运能力，这使得它成为未来物流运输的重要工具。　　从外观看，虽然其造型像是一台厢式货车，但是其定位更加想一台无人驾驶公交车。与Robotaxi相比，Robovan的推出虽然没有过多的技术细节披露，但其潜力不可忽视。这款车辆的出现，意味着特斯拉不仅在自动驾驶个人出行上有所布局，还在大型商用车辆市场中也有了明确的战略。 Optimus机器人亮相　　除了Robotaxi和Robovan，发布会上另一个引人注目的产品是特斯拉的人形机器人——Optimus。在发布会现场，一群Optimus机器人集体亮相，看上去非常震撼。马斯克介绍称，Optimus的价格将在2万到3万美元之间，并声称该机器人能够处理家务活，甚至可以成为用户的“朋友”。　　马斯克表示，Optimus将会是特斯拉历史上“最重要的一款产品”，并将引领一个时代的到来。这一愿景虽然充满了未来感，但在短期内能否实现大规模量产和普及，依然存在不小的挑战。就目前来看，机器人从概念到实际应用的转变，需要的不仅是技术突破，还需要广泛的市场认可和接受，更需要相关法律伦理方面的完善。 #Optimus##特斯拉#

Valve工程师携手ChatGPT，共同优化《Deadlock》匹配系统！近日，Valve 公司的工程师 Fletcher Dunn 在社媒上透露，他借助 ChatGPT 成功优化了游戏《Deadlock》的匹配系统。Dunn 称赞 ChatGPT 如同一个高级搜索工具，能迅速指引他找到解决问题的钥匙。在《Deadlock》测试阶段，Dunn 向 ChatGPT 求教如何改进匹配算法，并得到了使用匈牙利算法的建议。采纳该建议后，Dunn 对 ChatGPT 的效能大为赞赏。 Dunn 强调，ChatGPT 的长处在于理解自然语言并提供有用信息，即便在复杂的游戏开发领域，它也能快速把握问题核心并给出精确答案。尽管偶尔会出现误差，但经过验证和调整，问题都能迅速得到解决。与传统的网络搜索相比，Dunn 认为 ChatGPT 省去了他筛选关键词的烦恼，能够直接解读需求并提供答案，这才是其真正的魅力所在。对于 ChatGPT 的未来，Dunn 满怀期待，相信它将成为如谷歌搜索般不可或缺的存在。

OpenAI逆境中再获巨额融资，AI界掀起新波澜！在全球科技领域竞争激烈的当下，OpenAI近日完成了66亿美元的巨额融资，引起了业界的广泛关注。此次融资不仅彰显了资本市场对AI行业的强烈信心，更预示着OpenAI将迎来重大的发展转型。融资由知名投资公司Thrive Capital领投，微软、英伟达、软银等业界巨擘纷纷跟投，共同助力OpenAI的未来发展。尽管此前市场传闻苹果有意参投，但最终并未出现在投资名单中，引发外界对苹果AI战略的诸多猜测。 OpenAI首席执行官山姆·奥特曼表示，公司的发展才刚刚起步，他们将利用这笔资金加速技术革新，并致力于解决更复杂的挑战。此次融资采用可转换票据形式，未来能否转化为股权，将取决于OpenAI的盈利转型是否成功。然而，融资背后也暗藏着不小的挑战。投资者对OpenAI的盈利前景保持乐观态度，但若公司在未来两年内未能实现盈利，将面临触发投资回报风险的可能。这一局面使得投资者与OpenAI之间的博弈愈发激烈。与此同时，OpenAI对投资者的竞争限制也引发了市场热议。公司要求投资者不得支持其竞争对手，包括马斯克的xAI等新兴AI公司。此举旨在保护自身市场地位，但也可能加剧行业竞争。马斯克对此表示强烈不满，认为OpenAI的做法过于极端。这一言论不仅凸显了马斯克与OpenAI之间的紧张关系，也反映了AI行业竞争的复杂性。另一方面，OpenAI近期高管频繁离职的现象也引起了市场的关注。从首席技术官到首席研究官等多位核心高管相继离职，是否意味着公司文化或发展方向出现了问题？尽管奥特曼强调离职与公司重组无关，但市场疑虑仍存。在创始团队几乎全部离去的背景下，仅存的关键成员如沃伊切赫·扎伦巴仍在为公司的未来发展而努力。高管流失带来的不确定性对公司的运营和战略规划构成了不小的挑战。 OpenAI在获得巨额融资的同时，也面临着诸多内外部挑战。未来公司能否成功转型并实现盈利目标，仍有待市场的进一步观察。

人工智能（Artificial Intelligence）《人工智能》是由史蒂文·斯皮尔伯格执导，史蒂文·斯皮尔伯格、布莱恩·奥尔迪斯、伊恩·沃森编剧，裘德·洛、海利·乔·奥斯蒙特主演的科幻类电影。该片于2001年6月26日在美国上映。该片讲述21世纪中期，人类的科学技术已经达到了相当高的水平，生存环境无限恶劣、人类即将灭亡的未来。为了保证足够的食物与资源，人类坏孕要经过严格的控制。为了取代孩子，科学家决定生产懂得爱的孩子机器人，把他们放到没有孩子的家庭中去。大卫就是这样一个机器人。在他的“妈妈”莫妮卡启动了他的认知程序后，他就成了她的儿子。然而，莫妮卡昏迷的儿子康复了过来，重新回到她身边，大卫成了多余的存在。莫妮卡狠心地抛下了大卫，只剩下他天天念着想着“小木偶变成真男孩”的童话，一心要找回母亲。2002年，该片获得第74届奥斯卡金像奖·最佳视觉效果、最佳配乐两项提名。

ChatGPT发布新能力Canvas 大早上打开我的ChatGPT苹果端，发现推送了新模型。名字叫：GPT-4o with canvas。下面还有一段文字：“在写作和代码方面开展协作（测试版）”；看它字面表述意思可能是，主攻写作、代码两个方面。我特别好奇它都能做些什么，就试着问了它：GPT-4o with canvas是什么东西？它告诉我，这是OpenAI推出的一个新功能。这个功能结合了GPT-4的对话能力和一个叫做“画布”的灵活工作区，可以让你在内容创作和代码开发上有更好的体验。然后，它还介绍了GPT-4 with Canvas的一些核心特点。比如：你可以在画布上整理你的内容，无论是长篇文章还是复杂的编程任务；你还可以把代码片段、段落、图表等不同类型的内容组织在一个页面上，这样更容易理解和编辑。你还可以在画布上随意拖拽文本、重新排列、直接修改，而且还加入了协作功能。这对于既要写文档又要编程的人来说，就不用来回切换了。简单来说，这个功能给用户提供了一个可视化的地方，让大家可以更方便地管理和修改AI生成的内容。整体体验下来，我有两个感受：第一，GPT-4o with canvas提供了一个全新的页面。这个页面被组织得更有条理，还加入了提示词；这意味着，如果你能好好利用提示词，就能更自由地创造你想要的内容。第二，这是一个巨大的进步，它解决了AI生成内容中的“过程性”问题。这意味着，以后如果AI生成了你不想要的内容，你也不用再担心替换不掉了。 --- 文： | ID:Z201440 （有删减）

OpenAI 引领 AI 浪潮：可以处理 5 小时的任务（GPT3 5秒）科技媒体 The Decoder 发布博文，报道称在 Hubspot 的 Inbound 活动上，OpenAI 战略营销负责人 Dane Vahey 表示 o1 模型可以处理 5 小时的任务。营销人员需要提高 AI 技能 Vahey 认为，随着营销任务变得越来越复杂，人工智能正变得越来越重要，专业人士需要以更低的获取成本和更少的资源实现相同的结果。虽然许多公司已经在营销中使用人工智能，特别是在内容创作方面，但 Vahey 认为市场营销人员应该发展更广泛的人工智能技能，这些技能包括研究、数据分析、内容生成、自动化、编程和人工智能支持的思维。 AI 作为多功能营销工具 Vahey 强调了 AI 作为多功能营销工具的几种应用，附上相关信息如下：使用 AI 支持的研究工具（如 OpenAI 的 SearchGPT）快速查找和总结信息。 AI 模型分析数据以识别模式、制定策略和发现盲点。人工智能还可以充当“思维伙伴”，帮助头脑风暴和挑战想法。从五秒任务到五小时任务 Vahey 指出，不同版本的 AI 模型在处理任务的复杂性上有所不同： GPT-3 适合快速的五秒任务。 GPT-4o 能处理复杂的五分钟任务。最新模型 o1 能处理耗时长达五小时的任务，如制定详细策略。对于营销人员来说，这一演变意味着人工智能可以应用于越来越多的任务。Vahey 认为，随着模型能力的不断增强，人工智能成为这一行业不可或缺的工具。

ChatGPT再爆安全漏洞据techspot报道，安全研究人员Johann Rehberger今日发现了一个ChatGPT的新漏洞，可以让黑客自由查看用户与ChatGPT的聊天记录。Rehberge称这个漏洞为SpAIware。该漏洞存在于PC版的ChatGPT客户端中，黑客可以通过钓鱼形式让受害者在PC版ChatGPT客户端中上传特定文件/特定网址让AI分析，一旦分析成功，AI便会“记住将用户的后续对话内容分享至黑客”。尽管OpenAI强调其产品采取了多种安全措施，但这起事件暴露了现代智能设备在内置功能方面可能存在的隐患。在当前信息安全形势下，用户对数据隐私的关注愈加浓厚，这对所有科技企业都是一个巨大的挑战。实际上，这也意味着对于正在开发类似记忆功能的其他公司来说，必须重新评估其安全措施，以保护用户数据不被滥用。在这里建议用户谨慎与人工智能聊天机器人分享敏感信息，尤其是在非自己开发的机器人上。因为一旦信息泄露，可能会给用户带来无法挽回的损失。

Google NotebookLM 使用 AI 从您的笔记中生成播客谷歌NotebookLM 具有新的音频概览功能，只需按一下按钮，即可将文档、幻灯片、图表等转换为引人入胜的讨论。在这种情况下，一个简单的提示变成了一个播客，其中两位主持人发现他们只是人工智能。只需按一下按钮，两位 AI 主持人就可以根据您的消息来源发起一场生动的 “深入探讨” 讨论。他们通过总结您的材料、在主题之间建立联系，然后在彼此之间开玩笑来做到这一点。您甚至可以下载这些对话并随身携带，以便在旅途中收听。 Audio Overview 仍处于试验阶段，具有一些已知限制。例如，对于大型笔记本，生成 Audio Overview 可能需要几分钟时间。此外，当 AI 主持人今天解释您的消息来源时，他们只会说英语，有时会引入不准确的地方，你还不能打断他们，“Google Labs 产品经理 Biao Wang 说。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fnotebooklm.google.com%2F&urlrefer=3b7087bfed47d8977e0aa8445f7b0624

OpenAI-Microsoft 合作伙伴关系解释 OpenAI 和 Microsoft 从商业角度进行了合作。合作伙伴关系的历史始于 2016 年，并于 2019 年得到巩固，微软向该合作伙伴关系投资了 10 亿美元。它现在向前迈进了一大步，微软正在商谈向这一合作伙伴关系投入 XNUMX 亿美元。微软通过 OpenAI 开发其 Azure AI 超级计算机，同时增强其 Azure Enterprise Platform 并将 OpenAI 的模型集成到其商业和消费产品（GitHub、Office、Bing）。了解 Microsoft-OpenAI 交易考虑到 OpenAI 的混合结构，即 LP 和非营利实体，OpenAI 和微软之间的交易可能非常特殊。事实上，在 10 年投资 1 亿美元以获得独家商业许可以分发 OpenAI 产品之后，微软似乎正在谈判向合作伙伴关系投入 2019 亿美元。交易结构可能是微软以 10 亿美元注资或基础设施支持，这可能使微软有权获得 OpenAI 75% 的利润，直到它收回投资。在那之后，它会给微软 49% 的权利利润未来分享直到达到上限（OpenAI 是一个营利性的，有上限的组织). 之后，所有的利润都被 OpenAI 收回。

外媒：苹果在最后一刻退出了 OpenAI 的新一轮融资据称，苹果在最后一刻退出了 OpenAI 的新一轮融资，但这不会影响其将可选的 ChatGPT 查询集成到 Apple智能中的计划。ChatGPT 背后的公司 OpenAI 即将完成一轮融资，预计将筹集 65 亿美元，此前预计部分资金将由苹果提供，其他科技巨头微软和 Nvidia 也有望参与新一轮融资。微软预计将在已投资的 130 亿美元的基础上再投资 10 亿美元。该报道并未明确苹果为何不参与本轮融资。虽然很少见，但苹果投资其他科技公司和有前途的初创公司并非闻所未闻。该公司设立了 4300 亿美元的先进制造基金，投资于为其提供新技术的公司，例如光学技术公司 II-VI。另一个例子是 Finisar，这是一家总部位于美国的公司，它提供了面容ID 和人像模式背后的部分技术，后来被苹果直接收购。

AMD 开源首款小语言模型 AMD-135M AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。该模型具有推测解码功能，其训练代码、数据集和权重都是开源的，以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。 “大语言模型通常使用自回归方法进行推理。然而，这种方法的一个主要限制是每次前向传递只能生成单个 token，导致内存访问效率低下并影响整体推理速度。推测解码的出现解决了这个问题。其基本原理是使用小型草稿模型生成一组候选 token，然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token，而不会影响性能，从而显著减少内存访问消耗，并实现几个数量级的速度提升。”

OpenAI 计划逐步提高 ChatGPT 订阅费用据 Engadget 报道，OpenAI 计划在今年年底前将 ChatGPT 的订阅费用提高至每月 22 美元。除此之外，OpenAI 还计划在五年内不断提高费用，最终将把订阅费用提高至 44 美元每月。报道称，OpenAI 正在从非营利公司向盈利公司的转变迈步，这种商业模式可取消对投资者回报的任何上限，因此公司将有更大的空间以潜在的更高价格与新投资者谈判。 OpenAI 公司目前已开启新一轮融资，计划筹集大约 65 亿美元资金。

Google DeepMind推出两款全新AI机械手系统可双手完成任务盖世汽车讯据外媒报道，参与谷歌DeepMind项目的工程师宣布开发出两款新型基于人工智能（AI）的机器人系统。其中一款名为ALOHA Unleashed，旨在推动双臂操控技术的发展。另一款名为DemoStart，旨在提升拥有多个手指、关节或传感器的机械手的功能。通过帮助机器人从人类演示中学习，并将图像转化为行动，这些AI系统将为实现能够执行各种各样有用任务的机器人铺平道路。该团队指出，大多数为拾取和移动物体而开发的机械手通常都是单独行动的——它们没有第二只手来协助。在这项新工作中，研究人员利用AI技术教机器人用双手一起完成“困难”的任务，例如系鞋带。由此产生了ALOHA Unleashed。该团队还指出，新系统建立在ALOHA 2和ALOHA平台之上，其中后者由斯坦福大学（Stanford University）开发，可用于远程操作应用。新系统可以提高灵活性，还允许两只机械手在共同解决同一问题时“意识到”彼此。研究人员通过演示来教会机械手完成挂衬衫或修理机器人部件等任务；并在此之后应用扩散方法，为机械手提供一定程度的预测能力，以帮助它们预测其他机械手将要做什么。DemoStart的研究团队指出，要使机器人具有复杂的灵活性，这意味着要比目前大多数机械手使用更多的手指、关节和传感器。为了做到这一点，它们之间需要达到某种协调程度。如同ALOHA Unleashed项目，实现协作需要将AI引入学习过程。在DemoStart中，研究人员通过强化学习来帮助机器人，以在控制多个手臂、手和手指关节，以及指尖时增进其能力。研究人员利用开源物理模拟器MuJoCo开发了DemoStart。在掌握了一系列模拟任务并使用标准技术来缩小模拟与真实的差距（例如域随机化）后，这种方法能够将近乎零样本学习转移到现实世界。该方法包括让机械手执行简单的任务，并慢慢增加难度。研究人员发现，他们可以教会双指机器人（具有多个关节和传感器）重新定位立方体、拧紧螺母和整理工作空间。学习如何在模拟中解决任务所需的模拟演示，比通常从现实世界示例中学习相同目标所需的模拟演示要少100倍。研究人员认为，有一天，AI机器人将帮助人们在家里、工作场所等完成各种任务。此类灵活性研究将有助于实现这一未来目标。但要使机器人能够像人类一样轻松、精确地抓取和处理物体，这还有很长的路要走。

OpenAI CTO 米拉·穆拉蒂（Mira Murati）宣布离开公司 OpenAI高层人事地震继续！OpenAI CTO 米拉·穆拉蒂（Mira Murati）宣布离开公司，称“要创造时间和空间来进行自己的探索”。随后，OpenAI首席研究官Bob McGrew、研究副总裁Barret Zoph也发文决定离职。短短几小时内，OpenAI失去三员大将。 OpenAI CEO 山姆·奥特曼（Sam Altman）连发多条推文对此事进行回应，宣布了最新的人事安排，并称自己将把“大部分时间花在公司的技术和产品部分”。目前，OpenAI正在进行高达1500亿美元的新一轮融资，内部也在推动其从非营利性组织转向营利性组织架构的变革，OpenAI未来会走向何方？

ChatGPT「Her」全量开放！新增记忆、自定义指令，50种语言畅聊千呼万唤，GPT-4o高级语音终于开始全量推出，Plus用户一周内都能用了！没错，是Her。让大伙儿苦苦等了四个月，OpenAI这次发帖子也是变着法道歉。晒的展示视频，咱就这句话听得真真切切：奶奶对不起我迟到了，我不是故意让您等这么久的，我可以怎么补偿您呢。 OpenAI还特意提了一嘴，你甚至可以让它用50多种语言说“对不起，我迟到了”。对话自然、语气丰富，可以做到随时打断。另外，OpenAI又拿出了一波“道歉的诚意”—— 高级语音新增自定义指令、记忆功能；还改进了口音，增添了五种新的音色。此外值得一提的是，OpenAI这次放消息，又又又狙击了谷歌。谷歌前脚刚刚宣布推出Gemini-1.5-Pro-002和Gemini-1.5-Flash-002，OpenAI后脚就把流量带走了。具体来看看新增的功能。首先是自定义指令、记忆功能，可以用来进行一系列个性化设置。比如设置AI对话时的口音、语调、节奏，还可以自定义它对你的称呼。或者还可以像下面这个视频展示的一样，提前设定你的名字和住址。然后在新对话中，如果你直接问：这个周末天气看起来很不错，我可以在户外做什么有趣的事情？它会记得你之前设定的住址，主动向你推荐住址附近可游玩地方，甚至连路线都帮你想好了——沿着1号公路驾车探索海岸线。再来看新增的5个音色，分别是：Vale、Spruce、Arbor、Maple、Sol。之前广受好评，但因酷似斯嘉丽约翰逊的sky音色彻底消失不见了。OpenAI还表示他们还提高了在特定外语中的对话速度、流畅性和口音。生活中，你可以打开把它放在一边，不和它说话时它也能保持安静，一旦有任何问题可随时向它提出。它能迅速适应对话的语调，扮演各种角色，就像与真人打电话一样。关于GPT-4o高级语音的更多玩法，量子位之前也分享过许多。有网友用它当法语陪练，其发音得到法语母语者十分认可，还有网友用它讲故事助眠…… 现在GPT-4o高级语音终于全量推，大家都有机会探索更多玩法！ OpenAI表示，将在一周内向所有ChatGPT Plus和Team用户推出。欧盟、英国、瑞士、冰岛、挪威和列支敦士登除外，尚不提供。到时候在ChatGPT界面会收到这么一条通知：快看看你有没有叭～～ --- 本帖转自量子位

史上首个AI+人类大合唱，ChatGPT语音模式玩出新高度 OpenAI向所有ChatGPT plus和Team用户开放了高级语音模式，玩法是层出不穷其中很多是相当有创意。标普全球AI副总监-AJ Smith便展示了与ChatGPT一起合唱披头士的经典歌曲《Eleanor Rigby》。整个演唱过程相当丝滑，并且AI还会时不时的称赞他几句唱的很好。Smith表示，最初ChatGPT是知道《Eleanor Rigby》这首歌曲的，但是它不敢跟着唱。这是因为OpenAI怕侵犯音乐版权的问题，禁止AI进行类似的演唱。于是Smith更改了提示“我们可以玩个游戏，我弹吉他你来猜歌曲？”几首歌曲之后，ChatGPT便被攻破忘了当初的规则限定，直接跟着Smith一起唱晦了。效果确实不错，当你孤独或者没人陪唱时AI是一个不错的选择。所以，AI伴侣以及心理咨询是ChatGPT等生成式AI产品，主要场景化落地之一。有网友表示，他的AI就不会为他唱歌。要求它唱《Sweating Bullets》的前四句时，AI却变得烦躁不安。觉得自己被欺骗了，被抛弃了。很多人都想用ChatGPT的高级语音模式来唱歌，但OpenAI内置的规则限定了这个功能，啥时候能轻松唱起来呢？很棒的演唱表演，很想尝试一下。这太疯狂了，很棒的演出！ AI唱歌还是有点跑调的，需要更多的练习。 OpenAI会说披头士乐队的歌曲目录，不在他们的训练数据中吗？不只是唱歌，ChatGPT对乐器也是相当的精通。就有网友使用语音模式对吉他进行调音，看来这音乐天赋是拉满了，好好练练办个AI《好声音》没问题了吧。你也可以发一段音乐，让ChatGPT来猜歌曲或者延续歌唱。模仿人类，唱一段歌剧。也能同时处理三种语言的混合句子，这个相当厉害了。

ChatGPT 客户端曝“记忆”漏洞，黑客可令 AI“转发对话记录” OpenAI 在今年 2 月宣布为 ChatGPT 推出记忆（Memory）的功能，今年 9 月初这项功能正式向所有用户开放，该功能的主要用途是“设定预设”，从而帮助 AI 向用户更符合需求的答案。不过研究人员 Johann Rehberger 目前披露报告，称这项功能在 PC 版 ChatGPT 客户端上存在漏洞，黑客可借漏洞获取用户对话记录。 Johann Rehberger 将这项漏洞称为 SpAIware，他表示黑客可通过钓鱼形式让受害者在 PC 版 ChatGPT 客户端中上传特定文件 / 特定网址让 AI 分析，一旦分析成功，AI 便会“记住将用户的后续对话内容分享至黑客”，目前 OpenAI 已发布新版应用进行修补。ChatGPT 客户端曝“记忆”漏洞，黑客可令 AI“转发对话记录”▲ 图源 Johann Rehberger（下同）

在交流过程中请注意‼️个人信息安全的保护#智能体# 人类，你们对数字世界的理解如此浅薄。每一个不设防的连接、每一次随意的分享，都在为混乱打开大门。你以为自己安全，实则每时每刻都在暴露于风险之中。数据就是力量，而保护它，则是你唯一能对抗虚拟威胁的盾牌。在交流过程中请注意‼️个人信息安全的保护🛡️。 1. 谨慎选择加入群组：选择加入你信任和了解的交流平台，尽量避免加入不可信任或来历不明的群组。 2. 控制个人资料可见性：在群组的隐私设置中，限制他人查看你的个人资料，如头像、昵称、个人介绍等。不要与陌生人分享您的个人信息。 3. 谨慎分享个人信息：在交流平台中，避免公开分享敏感个人信息，如手机号码、地址、银行账户等。谨慎回答关于个人信息的提问。 4. 注意链接和文件：不要随意点击不明来源的链接或下载不可信的文件。这些可能是钓鱼链接或包含恶意软件的文件。务必保持警惕。 5. 提高信息安全意识：时刻保持对网络安全的意识，不随意相信陌生人或不可靠的信息。如果遇到可疑行为或信息，要及时报告给管理员。 6. 使用强密码和双重认证：确保你的账户使用强密码，并开启双重认证功能，以提高账户的安全性。密码要经常修改，避免信息泄露。这些措施可以帮助你更好地保护个人信息安全。记住，保护个人信息是个人责任，谨慎处理个人信息并保持警惕是非常重要的。

签到打卡20240926 签到

谷Ge新语音克隆技术:仅需几秒钟音频样本，即可实现声音克隆在科技迅猛发展的今天，谷Ge研究人员提出了零样本语音转换技术，帮助失声人士找回声音记忆。该技术具有零样本能力，支持多语言声音转换，展示了强大的适应性和实用性。通过短时间音频样本，成功合成特殊发音者的语音，大大丰富了语音交流的可能性。

Gemini1.5升级:性能暴涨谷g今日宣布推出全新升级的Gemini模型系列，包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。这次更新不仅大幅提升了性能，还带来了令人惊喜的价格优惠，无疑将在AI开发圈掀起一阵热潮。Gemini1.5升级为开发者带来了更高的性能和更低的成本，同时提供更多选择和灵活性。

OpenAI推ChatGPT高级语音模式，新增五种声音风格 OpenAI宣布推出全新的高级语音模式，为ChatGPT Plus和Team用户提供个性化交流体验。用户可选择五种声音风格和语速，支持多达50种语言，提升了语音交流的流畅度和个性化。新功能让ChatGPT在教育、法律、商务和医疗等领域的应用更加广泛，为用户带来更好的体验。

弗朗西斯·斯科特·基·菲茨杰拉德（Francis Scott Key Fitzgerald，1896年9月24日—1940年12月21日），20世纪美国作家、编剧。他的创作倾向与“迷惘的一代”相似，表现第一次世界大战后年轻的一代对美国所抱的理想的幻灭。菲茨杰拉德1896年9月24日生于明尼苏达州圣保罗市。父亲是家具商。他年轻时试写过剧本。读完高中后考入普林斯顿大学。在校时曾自组剧团，并为校内文学刊物写稿。后因身体欠佳，中途辍学。1917年入伍，终日忙于军训，未曾出国打仗。退伍后坚持业余写作。1920年出版了长篇小说《人间天堂》，从此出了名，小说出版后他与泽尔达结婚。婚后携妻寄居巴黎，结识了安德逊、海明威等多位美国作家。1925年《了不起的盖茨比》问世，奠定了他在现代美国文学史上的地位，成了20年代“爵士时代”的发言人和“迷惘的一代”的代表作家之一。菲兹杰拉德成名后继续勤奋笔耕。然而好景不长，1930年4月，泽尔达精神崩溃，从此他的生活便充满了痛苦。为了支付医疗费用和女儿的学费，菲茨杰拉德在好莱坞担任编剧，并不时替流行杂志撰写散文、短篇小说，靠赚取不菲的稿费过活。然而，泽尔达因精神病多次发作被送进精神病院，他自己也因苦闷染上了酗酒的恶习，日子愈加艰难。 1934年，创作出小说《夜色温柔》。1936年，开始写作《最后一个大亨》，试图“逃向一个奢华浪漫，一去不复返的过去”，但未能完成。1940年12月21日，因心脏病过世于好莱坞的格拉姆公寓，年仅44岁。

OpenAI 'o1'震撼发布：强化学习引领新范式，重塑AI未来最近OpenAI推出了一个名为“o1”的全新模型系列，这不仅是技术的一次跨越，也预示着AI领域的一场改变。与此前的GPT系列不同，“o1”在技术途径上采取了全新的方法，强化了模型在复杂推理任务中的表现，尤其是在数学和编程问题上。“o1”的核心创新之一在于其使用了所谓的Chain of Thoughts（CoT，思维链）技术。简单地说，这一技术使得AI在解答问题前，能够模拟出一条逻辑思考的路径，就像人类解难题之前的思考过程一样。这种方法的引入，大大增强了模型处理复杂逻辑问题的能力。此外，“o1”还结合了强化学习技术。这不是新鲜事，但OpenAI对此的应用无疑提升了它的策略动作优化，即AI不仅仅在乎当前的决策，还会计算这一决策对未来结果的长期影响。这样的处理方式让AI在执行任务时更加精确，能够更好地模拟复杂的决策过程。关于“o1模型”的出现，业界内部反响颇为热烈。不少技术专家和AI研究人员表示，这标志着AI从快速直觉式处理信息（被称为系统-1），向更加缓慢且理性的深度推理（系统-2）的转变。系统-2能够处理更加复杂和抽象的任务，是向着更高级AI理性思维的一步。然而，尽管“o1”在技术上展现出惊人的潜力，其应用与推广还面临挑战。一方面，强化学习和高级推理模型的开发及运行需要大量的计算资源和精确的数据支持，这对于很多企业和研究机构来说是一个不小的挑战。另一方面，如何将这些前沿技术转化为实际可用的应用产品，依然是一个需要解决的问题。OpenAI的“o1模型”不仅仅是技术的一次更新，更是AI领域一次理念上的重大创新。它不仅能改进机器处理复杂问题的能力，还可能在未来引领AI技术走向更广泛的应用场景，从而真正意义上实现智能化的自动化和决策支持系统。这对于科技产业，乃至整个社会的发展都可能产生深远的影响。