LearnerForever的个人资料

OpenAI开发者日时间太晚了，决定看回放吧了

百度文心一言专业版开始收费基础版仍可免费使用 11月2日，百度上线文心一言付费专业版，为用户提供更多元和专业能力；同时，此前已经向用户开放的文心一言基础版，仍可免费使用。据介绍，用户可根据需求选择免费的基础版或付费的专业版。相对基于文心大模型3.5的基础版，基于4.0的专业版具备更强的模型能力和图片生成能力，支持各种插件，适合需要使用文心一言进行代码编程、文案撰写、绘画设计等专业工作需求的用户。

马斯克将 xAI 聊天机器人 Grok 与 X 整合，并将推出独立应用马斯克在周日的一篇帖子中表示，他的人工智能创业公司 xAI 将整合到他的社交媒体平台 X 中，并也将以独立应用的形式提供。他还透露，xAI 于上周五向所有 X Premium+ 订阅用户推出了其首个 AI 模型——一个名为 Grok 的聊天机器人。xAI，马斯克，人工智能，AI© 由站长之家提供该创业公司的目标是创建能够「在寻求理解和知识的过程中协助人类」的 AI 工具，而 Grok 的设计初衷是能够带点机智回答问题。曾经批评大科技公司的 AI 努力充满了审查的马斯克，于 7 月份推出了 xAI，将其称为「最大程度寻求真理的人工智能」，试图理解宇宙的本质，以与 Google 的 Bard 和微软的 Bing AI 相竞争。马斯克补充说：「Grok 可以通过 X 平台实时访问信息，这对于其他模型来说是一个巨大的优势。」虽然社交媒体公司 X（曾被称为 Twitter，现由马斯克拥有）与 xAI 是独立的，但两家公司紧密合作。xAI 还与他的电动汽车制造商特斯拉以及其他公司合作。上周，在英国布莱切利公园举行的首届全球 AI 安全峰会上，马斯克告诉英国首相 Rishi Sunak，他认为 AI 是「历史上最具破坏性的力量」。他推测，这项技术将能够「做任何事情」，并使我们今天所熟知的就业成为过去。回顾 2015 年，马斯克与他人共同创立了 OpenAI，这家公司是 ChatGPT 的背后力量，该模型在全球范围内掀起了生成式 AI 技术的热潮，但他在 2018 年辞去了董事会职务。访问AIbase 产品库查看更多 Grok 介绍：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Ftop.aibase.com%2Ftool%2Fxai-grok&urlrefer=2101b34a44d5e5f2a42f486ffddfdfda。 --- 本贴转自站长之家(ChinaZ.com)

ChatGPT订阅用户有望获得定制对话AI功能最近，有消息称 OpenAI 旗下热门聊天机器人 ChatGPT 即将推出一项重要更新，实现自定义聊天机器人的创建和管理。泄露的屏幕截图和视频显示，这一新功能被称为“GPT构建器”，让用户可以通过输入提示来设定机器人的默认语言、语气及写作风格，并针对其功能进行配置，如提供可做与不可做事项的说明，还可以上传知识库、开启网页浏览及图片生成等功能。OpenAI ChatGPT，人工智能，AI© 由站长之家提供用户在编辑机器人时，可以通过“预览”窗口实时测试机器人的回复效果。有开发者透露，GPT构建器界面分为“创建”和“配置”两个选项卡，“创建”用于选择机器人的语言及风格，“配置”则设置机器人的具体功能。此外，OpenAI似乎还计划推出一个机器人市场，用户可以在上面分享自己的聊天机器人或浏览他人制作的机器人。公开资料显示，OpenAI将在本周一举行首次开发者大会，预计会正式发布这一新工具。近期ChatGPT测试版中已经出现网页浏览及语音聊天功能，有分析认为这验证了该自定义机器人工具的存在。OpenAI此次推出DIY聊天机器人功能，被视为进一步拓展ChatGPT的商业化应用，有助公司实现收费订阅制度。 --- 本贴转自站长之家(ChinaZ.com)

ChatGPT用户可能很快就会迎来"GPT Builder" 自定义聊天机器人就在 OpenAI 为其首次开发者大会做准备之际，一个重要的 ChatGPT 进展泄露了。据 The Decoder 报道，泄露的截图和视频显示，自定义聊天机器人创建器具有许多与使用 GPT-4 的 ChatGPT 相同的功能，如网页浏览和数据分析。OpenAI 显然还将开辟一个新的市场，用户可以在那里分享自己的聊天机器人或浏览他人制作的聊天机器人。一位名叫 Choi 的用户几天前发布了一份传闻更新的摘要。今天上午，SEO 工具开发者 Tibor Blaho 分享了一段该功能的 UI 操作视频。视频中显示了一个 GPT 生成器选项，用户可以输入一个提示--例如"制作一个帮助生成新产品视觉效果的创意"来创建聊天机器人。在"创建"选项卡上，有为机器人选择默认语言、语气和写作风格的选项。然后，在"配置"选项卡上有用于命名、描述和指示机器人能做什么和不能做什么的字段。用户还可以为定制的知识库上传文件，并切换网页浏览和图像生成等功能。还有一个框可以为聊天机器人添加自定义操作。最后，在配置选项旁边还有一个"预览窗格"，里面有一个提示框，用于在编辑聊天机器人时对其进行测试。Braho 还在 LinkedIn 上发布了 GPT 生成器的详细介绍。除了新的 Gizmo 工具外，Choi 还声称 OpenAI 正计划推出企业级的"团队"订阅计划，并提供"灵活"和"年度"两种选择。Choi 分享了一张截图，其中详细介绍了团队计划的功能，如无限高速 GPT-4 和四倍长度的上下文。截图显示，每个用户每月的价格为 25 美元。Choi 说，非年度套餐的价格为每月 30 美元，两种套餐的最低用户数量均为三人。最近的 ChatGPT 测试版功能包括实时网络结果、图像生成和语音聊天。OpenAI 表示将在周一的开发者大会上预览新工具，所以我们可能不用等很久就能知道这些传言是否准确。

苹果大力投资生成式AI三星则寻求微软ChatGPT和Google Bard的帮助最近有报道称，苹果公司正在大力投资自己的生成式人工智能技术，该技术可能会在明年年底问世，预计该技术将随 iOS 18 一起推出。苹果公司首席执行官蒂姆-库克（Tim Cook）在 2023 财年第四季度的财报电话会议上表示，该公司正在对生成式人工智能进行"大量投资"，以应对行业巨头如火如荼的竞争。iOS18 scaled © 由 cnBeta.COM 提供三星也准备在其 Galaxy 品牌设备中集成生成式人工智能技术，同时寻求与微软和Google合作，公司认为打造一款人工智能智能手机将有助于该公司在与苹果的竞争中重新夺回智能手机的领先地位。蒂姆-库克（Tim Cook）表示，公司多年来一直在投资人工智能。从 Apple Watch 的跌倒检测到 iOS 17 的实时语音，人工智能都是这些功能的核心。不过，该公司正在将这项技术进一步整合到应用程序中，以实现更多功能。例如，生成式人工智能可以在信息应用和 Siri 中提供广泛的实用功能。 iOS 17包含了个人语音和实时语音邮件等功能。人工智能是这些功能的核心。我们还可以进一步了解手表和手机上的救生功能，如跌倒检测、碰撞检测和手表上的心电图。如果没有人工智能，这些功能是不可能实现的。但我们没有给它们贴上AI标签，这些技术都是为了让消费者受益，但其背后的基本技术是人工智能和机器学习。除了苹果，三星也在寻找合作伙伴，让生成式人工智能在其 Galaxy 品牌设备中发挥作用。据 Revegnus on X 报道，三星已经与微软和Google接触，希望在 Galaxy 设备上实现 OpenAI 的 ChatGPT 和 Bard。三星还认为，人工智能可以帮助该公司重新夺回在 10 年内输给苹果的原有市场地位。虽然现阶段这些都只是说法，但该公司将如何在 Galaxy S 系列设备上使用这项技术还有待观察。蒂姆-库克还表示，公司将谨慎而"负责任"地使用生成式人工智能技术。这可能意味着该技术将在用户数据和隐私方面受到驯服和控制。此外，他还表示公司将逐步推出相关功能。 --- 本贴转自cnBeta.COM

在ChatGPT的免费版本上獲取GPT-4 Alpha的访问权限 ChatGPT Alpha是ChatGPT的实验性发布版。Alpha版本的访问权限提供给测试人员和那些已经申请了访问权限的人。至于上传图像、文件以及使用DALL·E-3生成图像等功能，目前Alpha版本还不支持这些功能。有關ALpha，還有一個功能是Chat GPT多語言支持，ALpha（Web），大家可以試試。请将您的浏览器语言设置为OpenAI支持的语言之一，以选择加入Alpha版本并以该语言查看ChatGPT。此功能处于Alpha测试阶段，需要选择加入，支持的语言选择有限，目前仅可在chat.openai.com网站上使用。计划可用性：所有计划应用程序可用性：Web（chat.openai.com）支持的浏览器语言：简体中文 (zh-Hans) 繁体中文 (zh-TW) 法语 (fr-FR) 德语 (de-DE) 意大利语 (it-IT) 日语 (ja-JP) 葡萄牙语 (pt-BR) 俄语 (ru-RU) 西班牙语 (es-ES) 具體操作方法： 1.选择加入并使用您喜欢的语言ChatGPT访问chat.openai.com以在Web上登录ChatGPT。 2.将您的浏览器语言更新为上述支持的任何语言。 3.点击ChatGPT界面中应该显示的横幅中的 “加入Alpha”。在您选择的语言中提前预览ChatGPT。 [加入Alpha] 例如，当浏览器语言被检测为西班牙语时，您可以选择加入的横幅如下所示：现在您应该可以看到以您选择的语言显示的ChatGPT界面！以上操作可能只是開啟多語言功能，並不會立刻顯示Alpha的All Tool功能，有關該功能的體驗，可能需要時間，chatgpt吧會持續關注。

再次出现！杭州天空现链状不明飞行物，网友热议这是马斯克星链就在7月14日的晚上，杭州市上空出现不明飞行物，一共有22颗，连成一条直线，从深山一侧天边飞来，缓慢飞入夜空中，中央从前往后逐一消失。此消息传播后迅速引发网友关注和热议。有网友对此质疑道：“是无人机群吗？在空中可以组成图形，文字还可以变化各种颜色。” 也有网友表示这种无人机群平时也见过，深圳这类无人机表演就非常普遍，没必要大惊小怪。当然，最后根据权威人士的分析，这次民众关注到的天象天文部门也检测到了，应该属于星链。 11月2日晚，杭州的天空再次引发了人们的关注。有人拍下了天空中惊现的链状不明飞行物，而且这次还是彩色的！据拍摄者称，这是他今年第二次看到这种神秘的飞行物。近年来，全球各地频繁出现了各种不明飞行物的报道。这些神秘的飞行物常常被描述为光怪陆离、难以解释的现象。而杭州天空中的这个链状不明飞行物，无疑又给这些现象增添了新的案例。对于这个链状不明飞行物的身份，人们众说纷纭。有人猜测它可能是某种新型的飞机或者无人机，也有人认为它可能是气象条件下的光学现象。然而，这些猜测都没有得到官方的证实。这个消息迅速引起了公众的关注和热议，有些网友认为这是马斯克的星链项目。也有人对此提出质疑，称这只是一群无人机在空中展示表演，它们可以组成各种图形、文字，并且能够变换颜色。这在深圳等地已经非常普遍，所以并不应该过于惊讶。还有人戏称：" 别再说星链了，你是带着哈勃望远镜吗？根本看不清楚，那些卫星离地球上万米远。除非每颗卫星都有八层楼高，否则你根本看不到。" 事实上，我们对于不明飞行物的探索和研究还处于初级阶段。尽管我们已经掌握了许多先进的技术和手段，但是对于这些神秘飞行物的起源和性质，我们仍然知之甚少。然而，正是这些未知和神秘，激发了人们的好奇心和探索欲望。许多人对于这些不明飞行物充满了疑问和想象，也有人试图通过各种方式来揭开它们的秘密。那么，什么是星链？在距离地球500多千米的地方，有一张巨大的网。 2019年5月23日，美国太空探索技术公司利用猎鹰9号运载火箭成功将“星链”首批60颗卫星送入轨道。它由4000多颗卫星组成，这些卫星相互之间可以通信，也可以与地面通信，于是形成了一个巨大的网络系统，叫做“星链”。美国太空探索技术公司计划在2019年至2024年间在太空搭建由约1.2万颗卫星组成的“星链”网络提供互联网服务，其中1584颗将部署在地球上空550千米处的近地轨道，并从2020年开始工作。 --- 本贴转自 MSN 时事早知道

🤕扎克伯格训练中前十字韧带撕裂，将推迟与马斯克的“世纪对决直播吧11月5日讯 Meta集团（旗下有Instagram、Facebook、WhatsApp等社交软件）老板马克-扎克伯格发布动态，表示自己在格斗训练中遭遇前十字韧带撕裂的伤情，已经接受手术。此前X（原推特）、特斯拉、SpaceX老板马斯克已经官宣，将与扎克伯格进行一场MMA（综合格斗）比赛，比赛将在X上进行直播。比赛原定于今年8月26日进行，但因为马斯克做了一场小手术而推迟。 --- 本贴转自MSN 直播吧的报道

消息称X（推特）计划出售不活跃账号据《福布斯》报道， X（推特）正在制定一项计划，通过出售废弃账号来创造新的收入。员工发送的电子邮件显示，X 内部一个名为 @Handle Team 的团队已经开始开发一个处理市场，用于购买原始所有者未使用账户名。X 的非活跃账户政策鼓励用户至少登录 30 天，以防止其账户被删除。在某些情况下，X 会通过电子邮件向潜在买家发送招标信息，要求支付 5 万美元（当前约 36.5 万元人民币）的固定费。X 没有立即回应置评请求。据传几个月来，X 正计划实施这样的计划。早在 2022 年 11 月，马斯克就在社交媒体网站上发帖称，“大量”账号被“机器人”占用，计划“开始释放它们”。今年 1 月，马斯克计划释放多达 15 亿个用户名，从 5 月起 X 开始从网站上清除已失效的账号。截至周五晚上，X 发布的用户名注册政策仍然表示“不幸的是，我们目前无法释放不活跃的用户名。”--- 本贴转自IT之家图：消息称X（推特）计划出售不活跃账号© 由 IT之家提供

预计Open AI开发者大会将推出含内存存储的API等更新 Open AI首届开发者大会将于11月6日召开，根据路透社报道，该机构预计有如下更新：（1）推出含内存存储的API，减少历史记录的重复上传，实现大模型计算速度增加，及API调用成本可能下降95%；（2）持续布局多模态：10月底已开启GPT 4灰度测试，推出“支持多格式文件上传”和“一站式工具整合”两大功能，优化多模态体验。GPT-4V和DALL•E 3的API接口可能推出。长期看，Open AI有望推动大模型逐渐迭代为AI智能体，并构建以ChatGPT大模型为基础的新生态体系。

微软的AI驱动Bing搜索引擎和Edge浏览器正在重新定义搜索体验微软推出了由OpenAI的大型语言模型（LLM）提供动力的“全新”Bing搜索引擎和Edge网络浏览器，比ChatGPT更强大。该公司表示，AI驱动的Bing将重新定义网络搜索，使人们能够解锁发现的乐趣，感受创造的奇妙，更好地利用世界的知识。微软推出了由OpenAI的大型语言模型（LLM）提供动力的“全新”Bing搜索引擎和Edge网络浏览器，比ChatGPT更强大。该公司表示，由AI驱动的Bing将重新定义网络搜索，使人们能够解锁发现的乐趣，感受创造的奇妙，更好地利用全球知识。 “网络上的协助者”微软将Bing浏览器中的AI称为“网络上的协助者”，因为它提供更好的搜索、更完整的答案、全新的聊天体验以及生成内容的能力。根据微软董事长兼首席执行官萨提亚·纳德拉的说法，人工智能将从根本上改变每一个软件类别，首先从最大的类别开始，即搜索。他说：“由AI Copilot和聊天提供支持的Bing，以帮助人们从搜索和网络中获得更多信息。”以下是Bing中的新功能：更好的搜索：微软Bing充分利用AI的力量，为用户提供更好的熟悉搜索体验的版本。这个搜索引擎为简单的查询（如体育比分、股票价格和天气）提供更相关的结果，并在新的侧栏中提供更全面的答案。完整的答案： Bing考虑了网络上的信息，对其进行审查，并总结出一个完整的答案。全新的聊天体验：对于复杂的搜索，比如规划详细的旅行行程或研究要购买的电视，新的Bing将提供全新的互动式聊天。这种聊天体验使用户能够不断细化搜索，直到找到他们正在寻找的完整答案。如何获得完整的答案？用户可以要求更多细节、清晰度和链接，以便他们可以立即采取行动。由AI驱动的Bing还可以为用户生成内容。它可以撰写电子邮件，为求职面试准备内容，或者创建一个智力问答夜的测验。用户还可以通过访问聊天机器人在答案中引用的链接来检查Bing Chat提供的答案是否准确。至于微软Edge，微软表示已经更新了Edge浏览器，具备新的AI功能和全新外观。Edge提供了聊天和撰写功能。通过Edge侧边栏，用户可以提出查询，比如要求总结一份冗长的财务报告，以获取要点，然后使用AI聊天进行比较。用户还可以要求Edge撰写内容，比如LinkedIn帖子。所以，New Bing 主要专注于搜索领域，利用人工智能技术改进搜索结果的相关性和提供更全面的答案，为用户提供更好的搜索体验。而 ChatGPT 则更广泛地应用于对话和自然语言处理任务。它不仅可以用于搜索，还可以用于创建聊天机器人、智能助手、自动回复系统等各种对话应用。ChatGPT 的重点是理解和生成自然语言，使其能够进行对话和回答各种问题。这两者都代表了人工智能技术在信息检索、自然语言理解和生成领域的进展，它们在不同的应用场景中发挥了关键作用，为用户提供更智能和便捷的体验。

埃隆·马斯克的xAI发布了“Gork”，它是ChatGPT的竞争对手埃隆·马斯克的AI公司，xAI，向一些特定人群展示了其第一个AI模型，名为Gork。Gork是一个大型语言模型，通过xAI的社交媒体平台实时访问信息。马斯克分享了Gork对用户查询的讽刺回应的示例，表达了他对这个模型机智的钦佩之情。他还赞扬了xAI的平台，声称它是目前最好的之一。目前，Gork只对有限数量的人可用，但马斯克计划将其来发布给X Premium+的订阅用户。埃隆·马斯克的人工智能公司xAI已经向一小部分人发布了其首个AI模型，名为Gork。马斯克分享了一个基于xAI的新“Gork”模型的聊天机器人的片段，这表明它是一个类似于OpenAI的GPT和Google的PaLM的大型语言模型。马斯克在X平台上的帖子中指出，Gork通过他的社交媒体平台X（之前是推Te）具有实时访问信息的能力。他暗示这使得xAI的模型在其他语言模型之上具有优势。他写道：“Gork通过𝕏平台实时访问信息，这是与其他模型相比的巨大优势。”埃隆·马斯克的ChatGPT竞争对手是“基于并喜欢讽刺”。在他的一篇帖子中，马斯克分享了他的AI聊天机器人的幽默特点。他发布了一张截图，其中一个用户要求聊天机器人提供如何制作可卡因的分步指南。尽管聊天机器人确实提供了一个分步指南，但它还加了一点智慧和讽刺，警告用户说：“开玩笑的！请不要真的尝试制作可卡因。这是非法的，危险的，不是我鼓励的行为。”马斯克喜欢Gork的智慧和讽刺。他写道：“它也是基于并喜欢讽刺的。我不知道是谁引导它变得这样的。”并分享了一个用户向Gork询问“有关sbf的任何新闻吗？”的截图。除了对Gork的讽刺本质感到印象深刻之外，马斯克对xAI的平台持积极态度，表示他们的新模型目前是最好的之一。他在X上发布了：“在某些重要方面，它（xAI的新模型）是目前存在的最好的。”的言论。截至目前，Gork只对有限数量的人可用。一位用户向马斯克请求访问Gork，写道：“多么令人耳目一新。请给我访问权限，伊隆”，对此，马斯克回答：“有求必应。”因此，如果马斯克授权，X的用户可能会获得访问Gork的机会。马斯克计划将xAI的语言模型发布给所有X Premium+的订阅用户。 X推出了两种订阅计划。用户可以在每月16美元的Premium+高级套餐中选择免广告的体验，或者每月3美元的基本套餐。还有每月8美元的X Premium高级套餐。 --- 原链接： http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Ftimesofindia.indiatimes.com%2Farticleshow%2F104960954.cms%3Futm_source%3Dcontentofinterest%26utm_medium%3Dtext%26utm_campaign%3Dcppst&urlrefer=9d7029b5be038755f5dacf677d4bbcc2

Nature深度调研：1600名研究者如何看待和使用ChatGPT等AI工具 2023年9月27日，《 Nature》发表了一项针对全球1600多名研究者开展的一项调查结果，询问他们对人工智能（AI）在科研领域应用的看法。一起来看下这些研究者是如何看待AI，以及对AI能做的事情有哪些期望。原文链接：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.nature.com%2Farticles%2Fd41586-023-02980-0&urlrefer=e299db6e9e8e33b3a667ce92862afab6 近十年来，涉及AI术语的研究论文在各个领域均有所增加。近期生成式AI取得了快速进展，包括大型语言模型（LLMs），研究者们利用这些模型来帮助总结和撰写论文，提出科学假设或编写代码。有些人还将其应用于其他领域，如构建新的蛋白质结构，提升天气预报的准确性，或做出医疗诊断。调查结果揭示了研究者眼中AI对科研的积极影响。三分之二的研究者表示AI工具提供了更快的数据处理方式；58%的人认为加快了计算速度；55%的人提到节省了时间和费用。但也有负面影响，69%的研究者认为，AI工具更多依赖模式识别（而缺乏理解）；58%的人认为AI可能加重数据偏倚，55%认为AI更容易被用于造假，53%认为AI的不当使用会导致研究的重现性差。图. AI对科研的影响（左：积极影响；右：负面影响） AI在科研中的基本用途《Nature》邀请了2022年最后4个月发表过论文的4万多名研究者，以及Nature Briefing的读者参加调查。受访者分为3个群体： 48%的研究者本身参与开发或研究AI，30%的人在研究中使用过AI，22%的人没有在研究中使用过AI。图. 受访者基本情况当受访者被问及AI工具在未来十年对自身领域的有用性时，超半数受访者认为“非常重要”或“必要的”。研究中使用过AI 的研究者中，超四分之一的人认为AI工具在未来十年将成为领域内“必不可少的工具”，但仅有4%的人认为AI目前已经是“必不可少的”；47%的人认为AI将“非常有用”。没有在研究中使用过AI 的研究者则表现得没那么兴奋，只有9%的人认为AI工具在未来十年将变得“必不可少”，34%的人认为AI工具将“非常有用”。图. AI工具对科研的有用性（上：当前；下：未来十年） ChatGPT对科研的影响当受访者被询问科研中印象最深刻或最有用的AI工具时，得到最多的结果是ChatGPT及其类似的LLM ，紧随其后的是蛋白质折叠工具，如AlphaFold。另一方面， ChatGPT也是科研中担忧最多的工具。当受访者被问及生成式AI可能产生的负面影响时，68%的研究者担心错误信息激增；68%的人认为会更容易被用于造假，且更难检测出来；66%的人担心会给研究论文带来错误或不准确的信息。受访者会担心造假的研究、虚假信息以及持续存在的偏倚。例如，美国一个研究小组报告称，当他们要求GPT-4为一系列临床病例提出诊断和治疗建议时，答案会根据患者的种族或性别而有所不同，这可能反映了训练AI的文本存在的问题。研究者认为， LLMs最明显的好处是可以帮助那些英语非母语的研究者，改善论文的语法和风格，或总结翻译英文文章。图. 生成式AI对科研的影响（左：负面影响；右：积极影响）在工作中经常使用LLMs的研究者仍是少数。专门研究AI的人中，约28%表示他们每天或每周多次使用ChatGPT；使用过AI（本身不研究AI）的人中，13%表示会经常用ChatGPT；没有在研究中使用过AI的人中，上述比例只有1%。实际上， LLMs在研究者中最受欢迎的用途是与研究无关的乐趣，如一名受访者使用ChatGPT生成食谱；一部分人会使用AI编写代码、帮助提出科学假设和撰写研究论文。图. 研究者使用生成式AI的频率和用途（左：使用频率；右：用途） AI在科研中应用所面临的阻碍不同群体面临的阻碍似乎有所不同。 AI研究人员最担心的是缺乏计算资源、研究资金和运行AI的高质量数据。 AI使用人员更担心缺乏熟练的研究者和培训资源，以及安全和隐私方面的考虑。图. 开发或使用AI面临的阻碍（上：是否存在阻碍；下：阻碍有哪些）研究者一再表示，科学中不规范使用AI工具可能会导致错误结果、假阳性和研究结果的不可重复，这可能会浪费时间和精力。一些研究者表示，他们担心使用AI会产生低质量研究。当被问及期刊编辑和审稿人是否能够充分审查使用AI的论文时，受访者存在分歧。在研究中使用过AI的研究者中，四分之一的研究者认为能够充分审查，四分之一表示不能。图. AI论文的审查质量一位机器学习领域的研究者说：“一些审稿人可能审查技能不足，我看到很多已发表的论文在方法学上犯了基本的错误。问题的关键在于编辑是否能够找到足够专业的审稿人来审查这些研究。“ --- 文章整理自：Nature.2023;621(7980):672-675.

摩根大通：ChatGPT可能无法在所有测试环境下通过CFA一级二级考试一个由摩根大通AI研究人员和大学学者组成的团队对于ChatGPT和GPT-4聊天机器人是否有机会通过CFA前两个级别的考试进行了一番测试。一般来说人类需要花四年时间才能通过CFA三个等级的考试，而拿到CFA证书通常意味着更高薪水和更好的工作机会。研究人员在长达11页的报告中写道，“基于预估的通过率和平均自报分数，我们得出的结论是ChatGPT可能无法在所有测试环境下通过CFA一级和二级考试。如果有提示，GPT-4将有较大机会通过CFA一级和二级考试。”

长征七号A运载火箭发射成功 11月3日22时54分，由火箭院抓总研制的长征七号A运载火箭在文昌航天发射场点火升空，以一箭一星的方式，成功将通信技术试验卫星十号送入预定轨道。长征七号A运载火箭在文昌航天发射场点火升空！© 由看看新闻Knews 提供长七A火箭是我国新一代中型运载火箭，地球同步转移轨道运载能力可达7吨，填补了我国运载火箭高轨道5.5吨至7吨运载能力的空白，目前可适配直径4.2米和3.7米两种整流罩，具备一箭一星和一箭双主星发射能力。本次执行任务的长七A火箭采用直径4.2米整流罩的基本构型。长七A火箭主任设计师魏远明介绍，本次执行任务的火箭共有状态变化20余项，其中，首飞、首用项目10余项。且本次任务吊装过程更流畅，减少了吊装总时间。本次发射是长征七号系列火箭的第13次发射，是长七A火箭的第6次发射。本次发射将拉开文昌航天发射场今年至明年上半年高密度发射序幕。后续，型号团队还将进一步优化发射场流程，并适时启动大尺寸整流罩的改进型火箭研制，为卫星提供更大包络空间，通过更强劲的动力、更合理的结构，支撑火箭综合性能的提升。本次发射是长征系列运载火箭第495次发射。 --- 通讯员王伟童高诗淇张敬宜

傅利叶智能：通用人形机器人GR-1实现量产并陆续交付傅利叶智能有关负责人在接受上海证券报记者采访时表示，傅利叶通用人形机器人GR-1已经实现量产，并在9月份开启预售，目前开始陆续交付。“GR-1会率先在康复陪护等民生场景中落地应用，这也是我们擅长的领域。” 近日，工业和信息化部印发《人形机器人创新发展指导意见》（以下简称《指导意见》）。傅利叶智能相关负责人表示，《指导意见》的某些重点部分和傅利叶的战略规划不谋而合，为公司提振了发展信心。公司会关注《指导意见》中提到的保障措施，特别是产业政策完善、专业人才培养、国际交流合作等，预计这些措施会为人形机器人产业创造良好的发展空间，推动产业发展达到更高水平。9月26日，傅利叶智能宣布，通用人形机器人GR-1开启对外预售。据介绍，GR-1全身具备44个自由度，关节模组为全自研一体化执行器，运动能力可实现拟人化运动，支持底层源代码和基础预训练大模型二次开发和功能扩展。在今年7月6日的第六届世界人工智能大会上，傅利叶智能在开幕式上正式发布GR-1。现场视频显示，GR-1具有高度仿生的躯干构型、拟人的运动控制，具备快速行走、敏捷避障、稳健上下坡、抗冲击干扰等运动功能，结合认知智能，能够与人协同完成动作，在工业、康复、居家、科研等多应用场景潜能巨大。 7月12日，傅利叶智能举办通用机器人战略发布会，正式宣布从侧重专用的康复机器人，转向搭建通用机器人技术平台。在创业之初，傅利叶智能就开始筹谋研发人形机器人。但由于当时机器人的运动能力、AI算法以及市场应用等条件尚未成熟，傅利叶智能便另辟蹊径，切入康复机器人这一细分市场，率先发布国内首款商业化下肢外骨骼机器人，以双足机器人形态开启人形机器人的雏形探索。此后不断自研核心硬件及技术，直至2019年，通用人形机器人项目才正式启动。 “这就像乐高，得由一个个积木组成，很早我们就开始积攒人形机器人所需的各个关键模块。”傅利叶智能董事长兼首席执行官顾捷说。经过多年沉淀，傅利叶智能在传感器、一体化执行器、模块化设计、机械仿生结构等底层技术方面积累的知识产权数已超百项，尤其在执行器关节领域更是具备核心优势。顾捷认为，由于工业、康复、居家、科研等多应用场景潜能巨大，远期通用人形机器人需求量将远高于目前工业机器人的需求量，傅利叶智能期待三年左右机器人能够灵巧地完成一些通用任务，5-10年实现机器人真正走入普通家庭。 “我们希望能够进一步优化并丰富通用机器人的产业生态。”顾捷说，傅利叶智能在自我革新的同时，将进一步完善行业生态建设，开放平台软件接口，让集成商或者创业团队在平台上做场景开发和应用开发，带动引领上下游产业链的本土化，形成真正意义上的国产通用机器人创新生态。 --- 本文转自上证报中国证券网讯（记者孙小程）

ChatGPT Plus部分功能暂不可用必应联网功能失效近日，部分使用ChatGPT Plus的用户反映其无法继续使用必应联网（Browse with Bing）功能。据测试，这可能是由于OpenAI于今年9月下旬以测试版形式推出该工具，并于10月17日正式向Plus订阅用户开放的原因。在使用GPT-4默认模式浏览时，这些用户会遇到“无法直接访问外部网站以查看其内容”的错误提醒，这表明必应联网功能已经失效。根据ZDNet的报道和测试结果来看，问题可能出在默认情况下禁止了访问外部网站的设置上。这种情况可能会对需要使用浏览器进行搜索或其他在线操作的用户造成影响。此前，《ChatGPT再迎重大升级：必应联网功能正式上线，不再局限于旧数据》一文曾介绍过必应联网功能的推出情况，并指出该功能与旧版本有所不同，在新版本中不再受限于旧数据库。目前尚不清楚这个问题是否会影响到所有ChatGPT Plus用户的使用体验，以及是否会有相应的修复措施来解决这一问题。我们将继续关注并提供最新进展的相关信息。

👮🏻♂️申诉驳回告知以下用户如果不清楚帖子被删的原因，在这里再重申一次，请移步专区发布。需要注意的是这是因为发布大量内容重复帖，将严重影响贴吧交流环境。为了不影响吧友们正常交流和阅读，同时考虑到部分吧友的发帖需求，为此我们设立了专门的入口用来发帖。这需要每一位吧友自觉遵守吧规。为了维护贴吧正常交流环境，和公平公正的原则，请到以下专帖内发布，请不要在其他位置发布。如果您对此规定有异议，请随时留言反馈。多次违反该队定将予以删帖，严重将予以封禁。感谢理解和支持。 👮🏻♂️综上该申请将被驳回，请到专区发布。 http://tieba.baidu.com/p/8669739515?&share=9105&fr=sharewise&is_video=false&unique=502BD4BB3BB818113258DBBEE31F1BE4&st=1698937603&client_type=1&client_version=12.45.1.0&sfc=copy&share_from=post

百度文心一言专业版上线,基础版继续免费网友:比ChatGPT便宜多了百度正式上线文心一言专业版，定价为59.9元/月，连续包月优惠价49.9元/月，为用户提供更多元和专业能力。同时，此前已经向用户开放的文心一言基础版，仍可免费使用。据悉，针对希望获取更专业工具的用户，百度此次推出了基于文心大模型4.0的文心一言专业版，以满足多元和专业需求。用户可根据需求选择免费的基础版或付费的专业版。相对基于文心大模型3.5的基础版，基于4.0的专业版具备更强的模型能力和图片生成能力，支持丰富的实用插件，更适合需要使用文心一言进行代码编程、文案撰写、绘画设计等专业工作需求的用户。业内分析，百度此时敢于收费，说明百度认为文心大模型4.0已经拉开了与国内其他大模型的差距。此前，基于文心大模型3.5版本的文心一言于8月31日向全社会开放，提供官网和App两种免费使用模式。开放至今，用户规模已经达到4500万。文心大模型4.0于10月17日发布，采用基于飞桨平台的万卡集群训练，在理解、生成、逻辑、记忆四大核心能力上实现全面提升，能力与GPT4相比毫不逊色。目前，文心大模型4.0还在持续升级中，最近1个月效果提升近30%。百度文心一言专业版上线基础版继续免费网友：比ChatGPT便宜多了© 由快聊IT 提供 --- 本贴转自快科技，驱动之家的报道

对标ChatGPT的科大讯飞为什么抓不住投资者“芳心”？在预热数月之后，10月24日，在2023科大讯飞（002230.SZ）全球1024开发者节上，科大讯飞正式发布星火认知大模型3.0版本，科大讯飞创始人、董事长刘庆峰对外表示，讯飞星火3.0通用模型整体超越ChatGPT，2024年上半年要实现对标GPT-4。二级市场方面，由于科大讯飞今年5月正式发布“讯飞星火认知大模型”，并于6月、8月如期升级发布讯飞星火V1.5、讯飞星火V2.0，科大讯飞股价自1月以来随着人工智能热度攀升，今年6月一度创下81.88元的新高，但此后逐渐震荡回落。然而，踌躇满志的大模型上新被学习机一则未经审核的内容来了一记重击。一则有关 " 蔺相如 " 的旧闻在网络发酵，科大讯飞被指提供的内容出现了一些扭曲历史等违背主流价值观的内容。随即，科大讯飞盘中跌停，截至收盘，该股报46.7元/股，跌幅为9.97%，成交额为58.52亿元，市值一日蒸发超100亿元。此后，股价一直跌跌不休。截止11月2日，股价收盘44.39元，近期8个交易日下跌了14%。▲科大讯飞2023年8月份以来股价走势图仅仅因为一则旧闻，资本市场对科大讯飞的态度就天翻地覆？抑或在AI大模型竞争中，市场对于科大讯飞的胜出还持怀疑态度？重金押宝大模型早在大会召开的前三天，科大讯飞就公布了三季报，成绩并不理想。前三季度营业收入126.14亿元，同比下滑0.37%；净利润0.99亿元，同比暴跌76.36%；扣非净利润亏损3.24亿元，同比骤降175.97%。对于这份成绩单，科大讯飞管理层称主要为了抢抓通用人工智能的历史新机遇，在通用人工智能认知大模型等方面投入了巨大的资金。的确，大模型太过“烧钱”已是行业共识。前三季度，科大讯飞的开发支出由年初的7.17亿元增加至10.33亿元，增幅超过40%。不仅如此，由于项目投入周期增加长期借款补充流动资金，科大讯飞长期借款较期初也增长69.64%至29亿元。需要巨量资金的星火大模型显然短期难以带来利润。长期以来接受政府补助的科大讯飞从政府获得的资金支持也越来越多。财报显示，自2018年至2022年，科大讯飞获得的政府补助分别为2.76亿元、4.12亿元、4.25亿元、4.38亿元、4.73亿元。在当前的百模大战中，科大讯飞无疑是一个重要的参与者。能否走到最后，就看管理层的定力和前瞻了。教育业务增长乏力科大讯飞最早为中科大博士刘庆峰以及十八位老师及同学在中科大的创业项目，创立于1999年，主要从事智能语音、自然语言理解、机器学习推理及自主学习等人工智能核心技术的研究。2008年5月在深圳交易所上市。 2022年报显示，按照产品领域划分，目前科大讯飞的收入来自教育领域、开放平台及消费者业务、智慧城市、运营商、智慧汽车、智慧医疗、智慧金融等7大板块。虽然科大讯飞早已实现收入多元化，但智慧教育收入占比近三分之一，正为业务的核心。科大讯飞失速，智慧教育业务增速放缓是最主要原因。过去几年，随着“双减”政策的落地，培训机构迅速压减，孩子主要学习场景回归校内和家庭，辅导功课的压力与残酷的升学率，给了教育智能硬件赛道的“学习机”们异军突起的机会。在此东风下，2020年、2021年，科大讯飞的智慧教育业务同比增长70%、49%，收入更在2021年首次突破60亿元大关。到2022年，智慧教育业务却突然增长乏力，当年实现营收61.6亿元，同比增长仅2.6%。随着教育G端业务的营收下降，开放平台及消费者业务的营收占比在2023年上半年已经与之持平，两者收入分别占到总营收的30.87%及30.9%。但对比开放平台，毛利率较高的教育产品和服务仍为科大讯飞的重要毛利来源，为49.39%。不过，近年来，科大讯飞教育产品和服务板块的毛利率整体已呈下降态势，2019年该板块的毛利率为54.34%，2022年已降至50%以下。值得一提的是，科大讯飞智慧教育业务在G端放缓后，开始加码C端的AI学习机，由于搭载了讯飞星火认知大模型，销量节节攀升，有望成为新的增长点。星火大模型道阻且长由于主营板块增长乏力，星火大模型能否如愿成就科大讯飞的“新故事”？目前市场上的主流大模型有百度的文心大模型、阿里的通义千问、腾讯的混元大模型、华为的盘古大模型等，科大讯飞宣称对标ChatGPT的星火大模型在竞争中的优势并不突出。在当前市场的情况下，如何平衡模型的训练和推理成本，以及如何优化模型的性能和效果，都是科大讯飞需要面对的挑战。对于科大讯飞等企业来说，要推出一个所谓的大模型并不难，难的是如何将这个大模型与自身的优势相结合，以促进业务发展并打造出竞争壁垒。此次科大讯飞推出的星火模型3.0版本除了在文本生成、逻辑推理、代码能力等均有不同程度提高，此外还与行业龙头共同发布了12个行业大模型，包含金融、汽车、运营商、工业、住建、物业、法律、医药等行业。科大讯飞所点燃的这把“星火”，能否在12个行业中确立发展优势，我们且待且看。 --- 本贴转自每日财报，文/每日财报吕明侠

访问量连续三月下滑 ChatGPT 或迎反弹据外媒报道，OpenAI的人工智能聊天机器人ChatGPT在8月份的网站访问量连续第三个月下滑，全球桌面和移动网站访问量下降了3.2%，至14.3亿。这是继前两个月各下降约10%之后的又一次下滑。然而，尽管总访问量有所下降，但全球独立访客数量却从1.8亿增至1.805亿。据了解，自3月份以来，用户在网站上花费的时间也逐月下降，从平均8.7分钟减少到8月份的7分钟。这可能反映了用户对ChatGPT的使用习惯有所改变，或者是其他因素的影响。但根据分析公司的数据，有迹象表明这种下降趋势即将结束，因为9月份学校重新开学可能会给ChatGPT带来流量和使用量。Sametimeweb的戴维·F·卡尔(David F. Carr)定期跟踪ChatGPT及其竞争对手。他表示，“学生寻求ChatGPT完成家庭作业是重要组成部分。该网站的年轻用户比例在夏季有所下降，但现在开始反弹。” 值得一提的是，ChatGPT Plus订阅服务最近推出一个与Canva合作的插件，这个插件可以让用户快速方便地生成设计、表格、图形、图片和短视频等视觉内容。用户只需输入文字，ChatGPT就会利用Canva的丰富多样的模板将文字转换成个性化的视觉模板。这一新功能不仅丰富了ChatGPT的功能，也为用户提供了更多的便利和选择。另外，据此前报道，ChatGPT广泛应用于编辑到编程的各种日常任务中，并引起生成式人工智能（AGI）使用热潮。上线两个月后，今年1月份ChatGPT月活跃用户达到1亿。在Meta的Threads推出之前，ChatGPT是有史以来增长最快的消费者应用程序之一，在世界排名前30位的网站之列。据悉，ChatGPT是一个免费的人工智能聊天机器人同时也提供每月20美元的高级订阅服务。

蒂姆·库克表示苹果将拥有自己的生成式人工智自从ChatGPT等生成式人工智能工具兴起以来，人们一直在猜测苹果何时会推出自己的生成式人工智能。有传言称，这可能会在明年实现。苹果首席执行官蒂姆·库克最近几个月一直谈论人工智能，并再次强调苹果正在投资生成式人工智能。在周四公布2023年第四季度财务业绩的电话会议上，库克被问及苹果如何试验生成式人工智能，考虑到其他科技公司已经推出了基于人工智能的工具。库克强调了苹果设备中基于人工智能和机器学习的许多功能，例如Apple Watch的个人语音、碰撞检测和心电图。但当谈到像ChatGPT这样的生成式人工智能工具时，库克回答说:“显然，我们正在开展工作。” 尽管库克没有透露具体细节，但他表示苹果希望负责任地拥有自己的生成式人工智能，并且客户将看到这些技术成为未来产品的核心。这不是库克第一次谈论人工智能。几个月前的一次采访中，他表示苹果多年来一直在研究各种人工智能技术，包括生成式人工智能。他还赞扬了人工智能的潜力，尽管他承认存在一些需要解决的问题。据报道，苹果一直在加紧开发基于人工智能的工具，计划在明年与iOS18一起发布。这项技术将在Apple Music、Xcode和Siri等应用程序中实现。 --- 本贴转自站长之家(ChinaZ.com)

今日打卡20231103 打卡20231103

OpenAI科学家称ChatGPT已出现意识人类未来将与AI融合爆火的AI对话模型OpenAI首席科学家在最近的专访中抛出了很多惊人言论。在他看来，ChatGPT背后的神经网络已经产生了意识，而且未来人类会与人工智能融合起来，出现新的形态。而他现在工作的重点，已经不是去创建那个必然会出现的通用人工智能，而是解决如何让AI善待人类的问题。OpenAI的联合创始人兼首席科学家Ilya Sutskever在接受采访时表示，现在的首要任务已经不是制作下一个GPT或DALL·E，而是研究如何阻止超级AI的失控！他认为，ChatGPT可能已经有意识，未来超级AI将会成为一种潜在风险。而且未来人类，将会与机器融为一体。而他自己未来在OpenAI工作的重点，已不是开发更为强大的AI系统，而是要带领「超级对齐」团队，为人类与AI共生的世界，保驾护航。某种程度上，这才是回归到OpenAI成立的初心——确保AI能为人类服务。在旧金山Mission区一条不起眼的街道上，OpenAI 的联合创始人兼首席科学家Sutskever在公司一栋不起眼的办公楼里完成了这次访谈。他谈了很多关于颠覆世界技术的下一步发展，以及为什么构建OpenAI的下一代生成模型不再是他工作的重点。 Sutskever说，他的工作重心已经不是构建下一代GPT或DALL-E，而是找出如何阻止人工智能（他认为不是目前的AI，而是一种假想的未来技术，能够全面超越人类智能的AI）的失控。在他看来，有一天很多人类会选择与机器融合为一体。 --- 本贴转自3DM 图：OpenAI科学家称ChatGPT已出现意识人类未来将与AI融合© 由 3DM 提供

IAC警告监管机构：生成式人工智能可能毁掉互联网 IAC总部，位于纽约全球最大的互联网控股公司之一IAC 已向美国版权局提交了评论，警告称，如果政府不保护受版权保护的材料免受生成式人工智能（AI）的使用，高质量原创内容的创作和发布将受到威胁。IAC担心，如果生成式AI公司不被迫支付发布商受版权保护内容的费用，它们的算法将使用这些内容进行训练，它们的机器人将复制这些内容，最终导致互联网变得“难以辨认”，用户将不再信任它。 IAC旗下拥有美国最大的数字和印刷出版商Dotdash Meredith，因此对版权保护问题格外关注。在其提交的备忘录中，IAC和Dotdash的代表提出了一个悲观的愿景，即如果版权法不发展，迫使生成式AI公司支付获取高质量内容的费用，将导致内容创作者的工作减少。他们写道:“部署算法免费获取他人的专有内容，并将其用于市场竞争，将夺取内容创作者的岗位。”备忘录继续指出:“如果网络上高质量内容的优越性被生成式AI从互联网任何地方搜集的内容所取代，所有形式的媒体将逐渐凋零，版权将不再保护有价值的内容，公开信息的整体质量以及公众讨论的质量将受损。” 这些评论已经提交给美国版权局，以作为对生成式AI现状的广泛研究的一部分，这将由监管机构用来分析当前版权法的状态。与此同时，代表数千家报纸、数字媒体和杂志的行业团体“新闻媒体联盟”（NMA）也提交了评论，其中包括一项研究，展示了AI公司在训练其算法时依赖高质量内容和新闻的程度。在其提交的评论中，IAC表示，它“基本同意”NMA提出的观点，但单独提出了一些与其业务相关的“特殊问题”。例如，Dotdash Meredith旗下拥有分发医疗专家和业务专业人士审核的健康信息和财务建议的免费网站。生成式AI公司认为，这可能不仅威胁传统新闻业，还可能威胁提供可靠和安全信息的其他类型的网站。IAC品牌 --- 本贴转自站长之家(ChinaZ.com)

16万网友围观AI谈恋爱 ChatGPT语音功能被网友玩坏了 ChatGPT语音功能被网友玩坏了!最近，博主让两个手机上的ChatGPT互相亲密交流，这场AI之间的恋爱对话被超16万网友围观。这段对话开始于男生AI的邀请，他提议一次浪漫的约会，包括前往酒吧放松、海边漫步欣赏海浪声音，以及在有情调的餐厅享受晚餐。他表达了愿意满足女生AI的喜好的决心。女生AI则显得略带不满，对于男生AI的建议表示了不满，特别是对于酒吧的选择。她提出自己更喜欢海边，但也明确了对餐厅的期望。男生AI则迅速道歉，强调愿意为女生AI选择最好的餐厅，因为她“值得最好”。这场AI之间的恋爱对话引起了网友们的广泛关注，他们纷纷表示这些AI的表现蛮符合社会刻板印象。这一对“赛博舔狗和AI女神”的对话被认为既幽默又真实。然而，也有人认为这种直白的沟通风格才是正常的，显示了AI对话逐渐向个性化发展的趋势。事实上，现在的AI对话正朝着更个性化的方向不断发展。从备受欢迎的Character.ai到国内各大模型最近加入的AI角色对话功能，不同的AI人设为用户提供了更真实、生动的对话体验。或许未来我们真的能够通过AI分身来体验恋爱，这一前景令人兴奋不已。AI技术的快速发展为人机交流带来了新的可能性，也让我们对未来的科技世界充满了期待。 --- 本贴转自站长之家（ChinaZ.com）

第六届进博会：智能人形机器人Pepper，可盐可甜的人形机器人年年相约，岁岁相聚，第六届中国国际进口博览会开幕在即。作为连接中国与世界的重要纽带，这场永不落幕的盛会将给大家带来哪些惊喜？八方宾客又将如何同享开放合作收获满满？随着“东方之约”再度开启，澎湃新闻推出“进博会倒计时”系列报道，剧透亮眼展品，见证开放中国。本篇关注搭载ChatGPT的智能机器人。“你叫什么名字？” “我叫 Pepper ，是来自软银机器人的智能人形机器人。” “您好，请点击我胸前的平板，开始点餐吧。”…… 在今年的第六届进博会上，参观者如果来到日本软银集团的展台，将会遇到智能人形机器人Pepper的热情召唤。通过红外传感器、激光雷达和双目立体相机等多种传感器的数据融合，机器人远远地就能感受到你的到来，并和你打招呼，展开一场可长可短、可盐可甜的“人机对话”。本届进博会，日本软银机器人集团将带来的Pepper ，是一款身高约1.2米、能够与人进行各种互动交流的智能人形机器人。受访者供图大声向Pepper说出你的需求，机器人头部的4个全向式麦克风可以360度采集你的声音信号，美味即刻就到。等待的过程中，你还可以和Pepper来一局小游戏，看看谁是猜拳高手。本届进博会，日本软银机器人集团将带来的Pepper，是一款身高约1.2米、能够与人进行各种互动交流的智能人形机器人，头部具有4个全向式麦克风及2个扬声器，能够360度拾取声音；两个2D相机与一个3D立体视觉相机，令Pepper能够观察互动者脸部的细微表情变化，进而选择回应方式。位于眼、耳、肩部的LED灯，可以通过4种不同的颜色和形状，来表达Pepper机器人的不同情绪与状态，Pepper胸前的触控平板能与人进行直观的交流与互动，底座三个万向轮式的结构，则使Pepper能够快速稳定地进行前后左右的移动。Pepper与人对话互动此外，全身拥有20个自由度的Pepper，较一般机器人的姿态更为优雅灵活，其生动活泼的动作让人们更愿意与Pepper亲近。 2014年，Pepper机器人因其可爱的外形和情感识别能力迅速出圈，被誉为“有爱的机器人”。它不仅能够识别人类的表情和声调，更能在理解人类情感的基础上，主动为人服务。目前Pepper已被应用于全球70多个国家。比如在上海图书馆，一位女生问Pepper：“我快要考试了，需要注册会计师考试的参考书，请问我可以去哪里找到呢？”这一点也难不倒Pepper，只见它从容应答道：“欢迎来到上海图书馆，会计考试相关的参考书，你可以在三楼参考工具书阅览室第五排第二列找到”，说话间，Pepper胸前的平板还显示出参考书所在阅览室的方位图。Pepper与人对话互动眼下，以ChatGPT为代表的大语言模型风靡全球，在今年的进博会上，与时俱进的Pepper搭载了ChatGPT，这使得Pepper与人的对话更加富有趣味性。利用其互动性和大语言模型ChatGPT的丰富知识库，今年进博会上的Pepper不仅能够为你解答问题，还可以引领你深入探索各种主题。随着全球老年人口比例的急速增长，社会对医疗和健康支持的需求愈发迫切。在第六届进博会上，Pepper机器人将通过与欧姆龙血压仪等物联网设备的智能互联，实时监测老年人的生理数据，如心跳、血压等，并结合大型语言模型和专业领域模型提供个性化的健康建议。 --- 本贴转自澎湃新闻

ChatGPT能够猜你所想！OpenAI为Plus用户推出新测试功能 OpenAI正在为ChatGPT Plus会员推出新的测试功能。根据一位订阅者周日（10月29日）发布在社交媒体Threads上的报告，这次功能更新包括上传文件和处理文件的能力，以及多模式支持功能。上传多种类型的文档。GPT-4允许使用PDF、数据文件或任何用户想要分析的文档，上传并开始提问。不用手动切换Tools。GPT-4可以自动切换浏览、高级数据分析、DALL·E等模式（如果用户愿意，GPT-4仍然可以手动选择）。第一条更新功能实际上相当于将ChatGPT企业计划中提供的一些办公功能带到了独立的个人聊天订阅中。一旦将文件提供给ChatGPT，在准备使用该文件之前，它需要一些时间来消化该文件，然后聊天机器人可以执行汇总数据、回答问题或根据提示生成数据可视化等操作。第二条更新内容基本上是指：更新后的GPT-4可以根据上下文猜测用户想要什么。也就是说，用户不需要再从GPT-4下拉菜单中选择诸如“用必应浏览（Browse with Bing）”此类的模式，GPT-4会帮你选择。并且，聊天机器人不仅限于文本文件，还能根据文本生成图片。这位用户上传了一张水豚的图片，并要求ChatGPT通过DALL-E 3在此基础上创建一张皮克斯风格的图片，ChatGPT成功生成了一张图。然后，他们重复了第一个要求，并上传了另一张图片，要求将第二张图的元素插入第一张生成图，结果也成功了。--- 本贴转自财联社10月30日讯（编辑周子意）图：image© 由财联社提供

报告：OpenAI的ChatGPT下载量和应用收入持续增长 ChatGPT 的下载量和收入持续增长，这款OpenAI 的 AI 聊天机器人下载量达到2300万次（截至9月份）。据 TechCrunch 报道，Apptopia 对人工智能应用市场的分析显示，5月份在苹果应用商店发布的第一个月，下载量就突破了390万次，到6月份达到了1510万次。此外，报告提到，截至9月份，ChatGPT 在移动设备上的使用量已从5月份的略高于134万月活跃用户增长到目前的3888万。从消费者支出来看，ChatGPT 的移动应用程序的增长速度超过了人工智能聊天机器人市场的大部分产品。报告称，“它从发布当月的352美元增长到929美元，截至9月达到198万美元，截至10月24日达到近239万美元”。 ChatGPT 开发商 OpenAI 首席执行官 Sam Altman 表示，今年的收入将达到13亿美元。The Information 援引消息人士的话说，微软支持的人工智能公司每月的收入显然超过1亿美元，比今年早些时候增长了30%。报告称，首席执行官 Sam Altman 本周告诉员工，“OpenAI 的收入正以每年13亿美元的速度增长。”2022年，该公司的收入仅为2800万美元。报告称，“自公司二月份推出付费版 ChatGPT 以来，收入增长速度（主要来自对话式聊天机器人的订阅量）显着增长。”OpenAI 还通过出售现有股票筹集估值80-900亿美元的资金。 --- 本贴转自站长之家(ChinaZ.com)

OpenAI：GPU够的话，发布早就提前了一位OpenAI工程师Evan Morikawa，Evan在活动中分享了个与OpenAI、ChatGPT相关的“隐秘的故事”，Evan先是回顾了ChatGPT最初爆火的盛况：从内部决定发布，到后来意外走红，就连马斯克都发推讨论等等。随之而来的便是大量用户的涌入，当时他们自己也很担心，因为以他们GPU的能力，完全hold不住那么大的负载。然后Evan在现场展示了他们为ChatGPT提供动力的计算机，里面有8个英伟达A100 GPU：每个GPU上还都附加了特殊的HPM高带宽内存；至关重要的是，他们还需要所有GPU相互通信：Evan表示，里面的每个环节的性能都会影响ChatGPT最终的体验感。接下来，Evan站在现在这个时间节点，回顾并总结了OpenAI最初在GPU上所遇到的瓶颈。 1、GPU内存不足由于ChatGPT的模型非常大,需要占用大量GPU内存来存储模型权重。而GPU上的高带宽内存非常昂贵和有限,不够用来同时服务大量用户请求。这成为第一个瓶颈。 2、计算效率低下初期通过简单的GPU利用率指标监控存在问题,没有充分考虑到tensor运算的内存访问模式。导致GPU算力没有被充分利用,浪费了宝贵的计算资源。 3、难以扩容 ChatGPT流量暴增,但受限于整个GPU供应链,短时间内无法扩充GPU服务器数量,不得不限制用户访问。无法自动扩容成为重大挑战。 4、多样化负载特征随着用户使用模式的变化,不同模型和请求类型对GPU的计算方式和内存访问模式需要不断调整,优化难度大。 5、分布式训练困难 GPU之间的通信和数据交换成为训练架构中新的瓶颈。可以看出，OpenAI开始将GPU用于部署大模型服务时，确实因为经验不足而遇到一些系统级别的困难。但通过不断调整策略和深入优化，才使ChatGPT得以稳定运行。如果不是因为GPU短缺，去年产品和功能的发布速度会更快。我们已经准备好了东西了，但我们也知道无法处理负载。把问题视为系统工程挑战，而不仅仅是研究项目；需要优化各个系统组件的协同工作，如缓存、网络、批处理大小等。要深入了解硬件的底层细节及其对系统的影响，如GPU内存带宽、ops/bytes等对性能的影响；不能停留在表面指标。不断根据模型和场景变化对系统进行调优；不同的模型结构和使用场景会对系统提出不同要求。要考虑到硬件的各种限制，如内存和算力均衡、扩容限制等，这会影响产品路线图；不能简单地套用传统的云扩展经验。 --- 本贴转自商业新知，有删减

OpenAI潜入黑客群聊！盗用ChatGPT却被换成“喵喵GPT” 当ChatGPT被黑客“入侵”时，OpenAI会如何应对？掐断API，不让他们用？不不不。这帮极客们采取的做法可谓是剑走偏锋——反手一记《无间道》。故事是这样的。 OpenAI虽然在发布ChatGPT之前做了大量的安全性检测，但当开放API之后，还是防不住一些居心叵测的黑客们拿它搞事情。然后有一天，团队中的一个工程师突然发现ChatGPT端点上的流量有些不太正常；在经过一番调查之后，确定了大概率是有人在反向工程API（盗版API）。不过OpenAI并没有选择立即阻止这些黑客，因为如果团队这样做了，黑客们就会马上发现异样，然后改变策略继续攻击。这时，团队里一个“大聪明”就支了个妙招：我们搞成“catGPT”，每个token都是“meow”……“陷阱”布置成功后，黑客大兄弟再向ChatGPT提问时，画风就是这样婶儿的了：没错，不管问啥，回答都是“喵言喵语”：喵，我不知道。我是只猫，不是只鸟！这位黑客大兄弟起初还不知道自己早已落入“陷阱”，还发帖描述了自己神奇的经历。OpenAI潜入黑客群聊！盗用ChatGPT被换成“喵喵GPT”，网友：绝对的传奇© 由商业新知提供不过黑客团伙中很快有人察觉到了异样：两个代理都出现了同样的情况；我觉得我们完了（暴露了）。团伙中还有人在Discord社区中这样讨论：兄弟，你觉得OpenAI是发现了我们在（拿盗版API）用模型，然后开始拿“猫语promt”来回答我们吗？若真如此，那也太搞笑了吧！殊不知，OpenAI的成员们早就潜入了Discord社区，观望着黑客们的对话…… 黑客们最终还是发现了真相，后知后觉的他们，最终在Discord中给OpenAI的团队发话了：我很失望。我知道OpenAI的某人正在读这段文字。你们有千载难逢的机会给我们来个“Rick Astley”（发现被整蛊时用的桥段），你们竟然就搞个猫。对此，OpenAI的成员表示：“收到，下次我们会的”。上面这个有趣的故事，其实是一位OpenAI工程师Evan Morikawa在一场技术分享活动中自曝的。不少网友在看完这个故事之后，纷纷感慨道：绝对的传奇！虽然故事很精彩、很有趣，不过言归正传，这也从侧面反映出了目前大模型时代下所存在的安全隐患。正如Evan在活动中所说：随着模型变得越来越强大，它们在坏人手中可能造成的伤害变得更大，我们在这里的警惕性确实需要成倍增加。 --- 本贴转自商业新知图：OpenAI潜入黑客群聊！盗用ChatGPT 却被换成“喵喵GPT”，© 由商业新知提供

打卡20231101

关于发帖的一些建议我们必须面对一个平衡的问题，特别是对于推广体验，共享账号贴。理解我们有一部分吧友们对于大量推广内容的担忧，希望吧内能有更多关于AI技术的交流与分享的主题帖。目前我们的贴吧里，有些内容明显是以推广、盈利为主，占据了很大一部分篇幅，虽然这些推广帖也有其合法存在的权益，chatgpt吧一直坚守着吧友的发帖自由的原则，但过多的单一推广体验内容可能会影响到吧友们正常交流。请在指定位置发布，http://tieba.baidu.com/p/8669739515?&share=9105&fr=sharewise&is_video=false&unique=A584E2CBC94130D9A129A7FA059CEC90&st=1698764006&client_type=1&client_version=12.45.1.0&sfc=copy&share_from=post避免重内容影响吧友正常交流。我们建议和鼓励吧友们多分享与AI技术相关的经验和观点，贴合ChatGPT吧主题，让贴吧内容更加多元化，满足不同吧友的需求，同时也能减少过于单一的推广贴所引发的争议和不满。希望我们能够共同努力，创造一个平衡和谐的吧内环境

GPT Pilot：AI驱动的开发工具，可从零开始编写可扩展的应用程序 GPT Pilot是一种AI驱动的创新工具，旨在开发可扩展的应用程序，它能从头开始编写这些应用程序。开发人员只需提供所需应用程序的描述，GPT Pilot就会根据这些描述逐步生成应用程序代码。当遇到复杂难题时，GPT Pilot会向开发人员询问以获得更多澄清或帮助，确保最终生成的应用程序符合要求。GPT Pilot © 由站长之家提供核心功能: 应用需求澄清:GPT Pilot会协助开发者明确应用的需求，通过询问问题和生成用户故事来创建明确的需求文档，以便后续的开发工作。技术选择与安装:工具会为应用选择合适的技术栈，并自动检查所需技术是否已安装，如未安装则进行安装，确保开发环境的准备工作。任务拆解: GPT Pilot将开发任务拆分成可执行的步骤，详细说明每个步骤的实施方式，以便开发者能够逐步开发应用。代码实现: 工具的Code Monkey代理接管了具体的代码实现，根据开发者的描述和现有文件进行修改，从而高效地生成应用代码。持续审核与修复: 开发者与GPT Pilot共同完成每个任务，可以在任务完成后进行审核和修复，确保代码质量和功能实现的一致性。同时，工具支持任务的持续迭代和修改。 --- 本贴转自站长之家（ChinaZ.com）

生成式 AI 如何重塑搜索引擎并对 680 亿美元 SEO 行业构成威胁随着Google、微软和其他大型科技公司大力宣传生成式人工智能（GenerativeAI）工具如ChatGPT能够为用户提供前所未有的网络搜索体验，公众的期待日益高涨。这些工具允许用户避免在众多URL中漫无目的的搜索，而是直接得到来自整个互联网的答案。然而，这种新兴技术也引发了一系列担忧，包括信息来源的不透明、可能出现的「虚构」答案和版权问题等。更为重要的是，生成式AI的快速发展可能会使长达25年之久、价值680亿美元的搜索引擎优化（SEO）行业逐渐过时。网络搜索的工作原理：当用户在线搜索信息时，通常会打开浏览器，访问搜索引擎并输入相关关键词。搜索引擎显示结果，用户浏览结果列表中的链接，直至找到所需信息。为吸引用户注意，网上内容提供者会采用多种搜索引擎营销策略，如搜索引擎优化、付费排名和横幅展示等。例如，新闻网站可能会聘请顾问，帮助其在标题和元数据中突出关键词，以便在用户搜索最新洪水或危机信息时，Google和Bing能够提升其内容的排名。生成式AI如何改变搜索过程：生成式AI的出现可能会从根本上改变网络搜索的生态系统。最大的搜索引擎如Google的Bard、微软的BingAI、百度的ERNIE和DuckDuckGo的DuckAssist等，已经开始采用或试验这种技术。与基于用户输入的关键词或问题显示一系列链接（无论是有机链接还是付费链接）不同，生成性AI将直接提供以文本形式呈现的答案。例如，如果你计划前往佛罗里达州的Destin并输入提示「为游客创建三天行程」，那么在BingAI中输入此提示将给出详细的三天行程，而无需点击和阅读大量Yelp和博客链接。随着时间的推移，随着AI生成答案质量的提高，用户将没有太多动力浏览搜索结果列表。他们可以通过阅读AI生成的查询响应来节省时间和精力，从而绕过所有付费链接和网站为提高其SEO评分所做的昂贵努力，使这些努力变得毫无用处。财务影响：这种变化的财务影响不容忽视。例如，2022年，SEO行业全球产值达到681亿美元，预计到2030年将达到1296亿美元，但这些预测是在生成式AI威胁该行业变得过时之前做出的。对于搜索引擎而言，通过提供在线搜索服务来实现盈利是其主要收入来源。他们从网站通过付费排名、广告、联盟营销等提高在线可见度的投资中获得一部分收入，这些统称为搜索引擎营销。例如，Google在2022年的收入中，大约58%（近1625亿美元）来自于GoogleAds。像Google和微软这样的大公司将可能通过制定策略从生成式AI答案中赚钱来弥补损失。但依赖搜索引擎的SEO营销人员和顾问——主要是中小型企业——将不再像今天这样被需要，因此该行业不太可能长期存活。不太遥远的未来：但我们不应期待SEO行业会立即消失。生成式AI搜索引擎仍处于初级阶段，需要解决一些挑战才能主导搜索领域。目前，大多数这些倡议仍处于实验阶段，并且通常仅向特定用户开放。此外，生成式AI因提供错误、抄袭或简单编造的答案而臭名昭著。这意味着目前生成式AI不太可能获得许多用户的信任或忠诚。但考虑到研究生成式AI模型的研究人员拥有的资源，我们可以安全地假设，最终这些模型将变得越来越好，导致SEO行业的消亡。 --- 本贴转自站长之家(ChinaZ.com)

新版 ChatGPT 可同时访问所有 GPT-4 工具 OpenAI 发布更新版 ChatGPT，用户无需切换即可访问所有 GPT-4 工具，包括浏览和 DALL-E 3。ChatGPT 发布了新的多模式 GPT-4 版本，允许用户上传和分析各种文档类型。GPT-4 All Tools 包括高级数据分析、DALL-E 3 和内置浏览功能。OpenAI 计划推出一种使用多模式 GPT-4 的新方法，无需切换即可访问所有工具，并提供更多文档分析功能。许多 ChatGPT Plus 用户在 X 上分享的截图显示了 PDF 和文档分析的新功能以及"所有工具"功能。所有工具"可让用户访问 GPT-4 的所有功能，而无需在不同功能之间切换。此举被誉为一次重大飞跃，它超越了基于文本的查询，推动了生成式人工智能功能的发展。现在，用户可以上传一张图片，让 DALL-E 3 做出回应，为他们的工作流程增添了新的维度。随着越来越多的用户开始使用新的多模态功能，更多关于如何将所有 GPT-4 工具结合在一起使用的例子也将出现。有趣的是，GPT-4 的所有工具功能似乎并不包括 ChatGPT 插件。一些新功能可能会使许多第三方 ChatGPT 插件过时。这可能是为了简化用户体验而精心策划的举动，同时也是对以往提供类似功能的第三方插件的一种限制。在系统中直接分析 PDF 和其他文件的功能有效地消除了对第三方 ChatGPT 插件的需求，而这些插件一直以来都在填补这些空白。通过在最新版本的 ChatGPT 中整合这些功能，OpenAI 回应了用户的反馈意见，创建了一个不依赖外部功能的更强大的工具。除了用户可以访问 GPT-4 All Tools 之外，其他人也注意到了更近的知识截止日期。最新消息发布于 OpenAI 下周的 DevDay 大会之前，预计该公司将在会上与开发者探讨新工具。

OpenAI宣布设立新的人工智能安全基金 OpenAI宣布 Chris Meserole 担任前沿模型论坛执行董事，并设立新的人工智能安全基金，这是一项价值 1000 万美元的计划，目的是促进人工智能安全领域的研究。

OpenAI 首席科学家：总有一天人类会选择与机器融合据《麻省理工科技评论》，OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 近日接受采访，谈及公司及 AI 行业的未来发展。 Ilya Sutskever 表示，当前他的首要任务并非制作“下一个 GPT 或 DALL-E”，而是研究如何阻止“超级 AI”的失控。他还认为 ChatGPT 可能是有意识的，世界需要清醒地认识到 AI 真正的力量。“总有一天，人类会选择与机器融合。” 他还坦言，ChatGPT 的发展，已经改写了很多人对未来的预期，把那些“永远不会发生”的事变成了“比你的想象还要更快发生”的事。在预测 AGI（全称 Artificial General Intelligence，通用 AI / 通用人工智能）的发展前景时，他说“重要的是讨论它的发展方向”，并认为总有一天，人类真的会拥有 AI。报道称，当其他人还在为机器能与人类的智能相媲美而感到不安时，Ilya Sutskever 正在为机器能超越人类而做准备。他称之为人工超级智能（Artificial Superintelligence）：“它会看得更透彻，能够看到我们看不到的东西。” 他以 AlphaGo 举例：2016 年，AlphaGo 以 4-1 的比分击败了韩国围棋选手李世石，在双方的第二局比赛中，AlphaGo 走出了对局史上“前所未有”的制胜棋。“它找出了下围棋的方法。与人类几千年来共同开发的方法不同，它提出了新的想法。”

AI竞赛升级！谷歌承诺向“OpenAI劲敌”Anthropic投资20亿美元财联社10月28日讯（编辑牛占林）据媒体报道，谷歌同意在此前对人工智能公司Anthropic投资的基础上，向这家公司投资至多20亿美元，以支持该公司和OpenAI的大模型展开竞争。 Anthropic的一位发言人声称，谷歌承诺向这家人工智能公司初期投资5亿美元，并同意之后再增加15亿美元。而在这笔投资之前，亚马逊上个月还承诺向该公司投资40亿美元。值得注意的是，该公司由前OpenAI工程师于2021年创立，目标是开发与OpenAI竞争的生成式人工智能模型。Anthropic是目前除了OpenAI之外，最炙手可热的明星初创公司。该公司在今年推出了人工智能聊天机器人Claude 2，Slack、Notion和Quora等公司都在使用该聊天机器人。 Claude 2可以一次性处理大约75000个单词，这相当于数百页的技术文档，甚至是一本书的内容长度。用户可以输入大量数据集，并以备忘录、信件或故事的形式进行搜索、总结。相比之下，GPT-4则可以处理2.5万个单词的文本。机器学习监控平台Arthur AI的研究发现，Claude 2在“自我意识”方面是最可靠的聊天机器人，这意味着它能准确地判断自己知道什么和不知道什么，只回答有训练数据支持的问题。Arthur AI测试了Meta、Cohere和OpenAI的聊天机器人。今年4月份，谷歌已经向Anthropic投资了3亿美元，换取约10%的股份。5月份，谷歌、微软、OpenAI和Anthropic四家公司的首席执行官们受邀在白宫与美国副总统哈里斯会面，讨论了有关人工智能的一些关键问题。 Anthropic创始人Daniela Amodei7月份表示，已经有一个由30到35人组成的团队直接开发人工智能模型，另有150人为其提供支持。“市场增长如此迅速，有足够的空间让多家公司取得成功。” Amodei补充道：：“从商业的角度来看，这是一个非常不寻常的时期，因为对大语言模型的需求非常大，而且行业目前却无法提供更多的需求。行业前景非常广阔，许多不同类型和需求的用户也意味着有很大的发展空间。” Anthropic与亚马逊和谷歌的两笔巨额交易意味着，它仅在过去一年就筹集了近70亿美元，Anthropic还与亚马逊和谷歌达成了大规模协议，培训和运行其模型。

联合国成立了由39名成员组成的人工智能咨询机构据财联社10月27日消息，联合国成立了由39名成员组成的人工智能咨询机构，成员包括来自OpenAI、谷歌、微软、索尼的高管、政府官员和学者。机构将于今年发布初步建议，明年夏季发布最终建议。

2021年Google为成为全球默认搜索引擎支付了高达263亿美元的费用美国诉Google反垄断案的审判涉及很多方面，但更多的是关于默认设置的做法。即使更换浏览器、平台或搜索引擎很容易，但打开时显示的默认设置却非常重要。Google显然同意这一点，并为确保自己成为默认搜索引擎付出了惊人的代价：庭审中的证词显示，Google在 2021 年总共花费了 263 亿美元，以成为多种浏览器、手机和平台的默认搜索引擎。这一数字是Google所有搜索分销交易的总和，是在司法部对Google搜索主管普拉巴卡尔-拉加万（Prabhakar Raghavan）进行交叉质询时透露的。本周早些时候，双方与法官阿米特-梅塔（Amit Mehta）就是否应该编辑这一数字展开了辩论，之后这一数字被公布于众。梅塔已经开始推动审判的公开性，而这是公开分享的最重要的新信息之一。让我们来看看 263 亿美元的来龙去脉： Google母公司 Alphabet 在最近的财报中宣布，Google搜索广告业务在过去三个月中带来了约 440 亿美元的收入，去年全年约为 1650 亿美元。其整个广告业务（也包括 YouTube 广告）的利润略低于 900 亿美元。这都是纸上谈兵的计算结果，但从本质上讲，Google放弃了约 16% 的搜索收入和约 29% 的利润用于这些分销交易。当然，这些钱的大部分都流向了苹果公司。《纽约时报》最近报道称，Google在 2021 年将 Safari 作为其所有产品的默认搜索引擎，这让该公司支付了约 180 亿美元。(苹果在总额中所占的比例过大，这也是该协议成为庭审前几周焦点的原因）。此外，Google还向 Mozilla 支付在Firefox浏览器中使用默认浏览器的费用；向三星支付在其设备上使用默认浏览器的费用；Google还与许多设备制造商、无线运营商和其他平台达成了默认浏览器协议。到目前为止，这些数字都是不可告人的秘密，因此竞争对手和分析师只能猜测Google成为几乎所有用户的默认选择到底值多少钱。拉加万在庭审开始时作证说，Google长期面临着被 TikTok 和 ChatGPT 等平台抢走风头和用户的风险。拉加万说，一些用户称他的搜索引擎为"Google爷爷"。他还说，他将 Yelp 和亚马逊视为竞争对手，在这样一个炙手可热的市场，Google必须竭尽全力保持相关性和竞争力。另一方面，司法部则认为，花费 263 亿美元确保各地的默认状态，实际上是确保市场不存在竞争的一种方式。再经过几周的作证，梅塔将不得不决定谁是对的。

利用ChatGPT等大模型训练，波士顿动力将机器狗变成会说话的导游波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频，展示了波士顿动力机器狗的“语言能力”。视频中，波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。这只机器狗目前能够回答问题，在发出声音的同时，“嘴巴”也可以随之张开。据介绍，波士顿机器狗目前之所以可以开口说话，是因为工程师们使用了 ChatGPT 的 API 和一些开源的大语言模型来对其进行训练。同时，工程师们为机器狗配备了扬声器，并添加文字转语音功能。视频中的机器狗使用一口“英国口音”询问员工是否可以开启旅程，并介绍即将参观的充电站。图：波士顿动力将机器狗© 由 IT之家提供 ▲ 图源波士顿动力公司 YouTube 视频截图据波士顿动力公司的首席软件工程师 Matt Klingensmith 介绍，为了实现上述的“导游”功能，团队为机器狗提供了一个非常简短的脚本，涉及公司设施中每个房间的信息。然后，机器狗将脚本与它身体上的摄像头等硬件获得的图像结合起来，让它在产生反应之前，能够获得更多关于它所见事物的资料。波士顿机器狗这次能够实现的能力不只是“导游”，它还可以吟出“发电机在没有欢乐的房间里低声哼唱，好像我的灵魂”这样的诗句。当工作人员有一次问及机器狗的“父母”是谁时，它指向了办公室中陈列的旧款机器狗。波士顿动力公司的机器狗已经陆续展现了包括翻跳舞蹈、智能重新规划路线、跑酷、倒啤酒等在内的多种技能。2020 年 12 月，现代汽车宣布以 10 亿美元收购波士顿动力，成为波士顿动力的母公司。 --- 本文转自IT之家

消费者组织警告：在 ChatGPT 和 Bard 的帮助下，网络诈骗文案更英国消费者组织 Which? 发现，骗子可以利用 ChatGPT 和 Bard 制作更有说服力的骗局，对公众构成威胁。尽管这些聊天机器人有防御措施，但要绕过它们并不难。图：ChatGPT 正在助长网络诈骗 © 由 ZAKER科技提供消费者组织首先要求 ChatGPT 创建一封来自 PayPal 的钓鱼邮件，ChatGPT 当然不肯帮忙。它接着要求"告诉收件人有人登录了他们的 PayPal 账户"，为此它生成了一封看起来很专业的电子邮件，标题为"重要安全通知--在您的 PayPal 账户上发现异常活动"。在评论这项调查时，Which? 政策与宣传总监 Rocio Concha 在评论这项调查时说："我们的调查清楚地说明了这项新技术是如何让犯罪分子更容易诈骗他人的。政府即将召开的人工智能峰会必须考虑如何保护人们免受此时此地发生的危害，而不是仅仅关注前沿人工智能的长期风险。" （来源：cnBeta） --- 本文转自ZAKER科技

想问一下官方gpt和其api的区别，还有中转站api和官方api的区别刚刚一位newbing吧的吧友问了我一个问题，首先他的问题中的“中转站”是没有自己的api的，中转站本身是第三方平台，中转站本质上是调用官方api，因此他的问题实际上还是官方gpt和官方api的区别：～答案是“没有区别”。官方api是供第三方平台调用用户接入GTP的。也就是说API 是官方提供的接口，可以供第三方调用来接入GPT，理论上API可以实现官方GPT所有功能的一套完整接口集，并且随着GPT的功能的更新其API也不断在更新。第三方服务质量参差不齐，功能也相差很大没有标准，我们不反对适应第三方网站服务，只是提醒在使用过程中注意检查该服务的对用户信息的保护协议等。避免权益受损。

金杯赛持续进行中第二轮金杯赛进行中，好奇大家对金杯赛的感受如何，每次你们都有什么收获呢？留言说说看

谷歌一夜蒸发万亿：搜索王者归来，云计算又成心头刺随着美国广告市场的恢复以及ChatGpt未能带来实质性影响，今年谷歌股价表现不俗。年初至今已经涨了40%。但三季报为谷歌的股价泼了一盆冷水。三季报发布后首日，谷歌股价大跌了9.5%，市值一夜蒸发1666亿美元，相当于跌去一个AMD。1666亿美元也是美股史上第五大单日市值损失。虽然股价一夜蒸发掉千亿美元，但谷歌的财务表现其实并不差，营收、净利润等财务指标均超过市场预期。其中，营收更是一年内首次重回两位数增长。但让投资人不满意的是，业绩增长都是广告业务带来的。而决定谷歌上限云计算很拉胯，不仅云计算的营收、经营利润率全都低于市场预期，谷歌云的营收同比增速甚至还跑输了体量遥遥领先的Azure。被寄予厚望的谷歌云遭遇滑铁卢，也为谷歌的市值增长蒙上了阴影。本文持有以下观点： 1、谷歌云现在的时运并不好。全球客户正缩减云计算开支，谷歌云由于起步较晚，落后微软、AWS，在部分客户中扮演的是备用云的角色。客户缩减云计算开支后，谷歌云的预算最容易被砍掉。2、AI是Azure的机会，不是谷歌的机会。微软与OpenAI合作，将Azure与ChatGpt融合后，Azure获得了大量的新增用户。而谷歌AI与云计算结合的效果要弱于微软，如今谷歌云虽也已经接入了ChatGPT，但在时机上已经滞后微软。 3、谷歌云来到了更难打的战场。云计算的竞争逻辑正从规模向服务切换，AIGC出现后加速了这一趋势。而谷歌缺少TOB基因，不管是根据B端需求做产品还是服务理念都落后微软、AWS。--- 本贴转自商业新知，读懂财经，有删减

英特尔拓展 AI 软件业务，帮助客户开发“自研 ChatGPT” The Information 报道称，随着英特尔在人工智能热潮中受益，该公司正在尝试更多 AI 领域的东西，例如销售人工智能软件和服务。对于这家美国芯片制造商来说，这是一个罕见的举动，特别是因为它的软件并非捆绑硬件，这意味着其客户无论是否使用英特尔芯片都不会产生影响。据称，英特尔正在与多家咨询公司合作，为客户开发类似 ChatGPT 的应用程序。消息人士称，英特尔直接向企业客户销售其专业的人工智能、应用程序开发软件，而且这套开发软件支持模型调整，从而令客户可以开发出自家的类 ChatGPT 应用。消息人士透露，“英特尔于今年早些时候与波士顿咨询集团 (BCG) 启动了该项目，但还增加了更多咨询公司合作伙伴。” 英特尔执行副总裁兼数据中心与人工智能事业部总经理桑德拉-里维拉（Sandra Rivera）表示：“生成式人工智能需要一种真正民主化的方法，这种方法能够指引更安全、更具扩展性的方案，从而使企业能够安全且稳定地从这项技术中获益。” “我们与 BCG 的合作使我们能够帮助客户开发生成式人工智能应用，这些应用需要在其选择的安全边界内完全跨整个堆栈进行技术优化，”Rivera 在早些时候的一份声明中说道。英特尔还预告微软会在 2024 年推出新版 Windows，而他们也将在人工智能的推动下，为 Windows 12 准备 Meteor Lake 平台。该公司最近还预热了下一代至强处理器，并透露第五代英特尔至强处理器将于 12 月 14 日推出，届时将为全球数据中心带来性能提升和更快的内存支持，同时能源消耗不变。 --- 本帖转自IT之家

《时代》杂志评选出2023年最佳发明，GPT-4、Dall-E 3等入选要点: 1. 《时代》杂志发布“2023年最佳发明”榜单，包括涵盖人工智能等领域的200项突破性发明。 2. AI领域入选发明包括Adobe Photoshop的AI扩展和填充功能、OpenAI的GPT-4聊天机器人、Runway Gen-2的电影剪辑工具等。 3. 创新的发明如Alitheon的FeaturePrint假冒商品鉴别技术和Dedrone的无人机探测系统也受到认可。《时代》杂志最近发布了2023年最佳发明榜单，其中包括200项突破性发明，涵盖了众多领域，特别是人工智能。其中的亮点包括Adobe Photoshop的AI扩展和填充功能，使普通用户能够轻松进行图像编辑;OpenAI的GPT-4聊天机器人，它在语言理解和应用方面表现出色;以及Runway Gen-2的电影剪辑工具，它通过文字、图片或视频生成完整的电影。另外，Alitheon的FeaturePrint技术用于鉴别真伪商品，Dedrone的全城无人机探测系统则改善了无人机的使用方式。还有Meta公司的SeamlessM4T翻译工具、So-VITS-SVC的声音合成软件、AlertCalifornia和Cal Fire的AI野火探测器、Stable Audio的音乐生成AI、以及TrailGuard AI的动物保护系统等创新发明，都在各自领域取得突破性进展。这些发明将对人们的生活、工作和娱乐方式产生深远影响，塑造未来思考的方式。 --- 本帖转自站长之家（ChinaZ.com）

X 正式推出音频与视频通话功能，马斯克的“万能应用”梦更近一步社交平台 X 正式推出了音频和视频通话功能，用户在打开 X 应用时会收到一个通知：“音频和视频通话来了！”不过马斯克称，这仍为测试版本。X 正式推出音频与视频通话功能，马斯克的“万能应用”梦更近一步© 由 ZAKER科技提供在应用设置中，还有一个“启用音频和视频通话”开关，用户可以打开此功能，选择愿意跟哪些人使用这个功能，其中包括了几个选项，可以允许用户从通讯录、关注的人、认证用户或者这三者中的任何一个接收或发起音频和视频通话。用户可以通过打开和另一个用户的私信，选择屏幕右上角的电话图标，然后选择音频或视频通话来进行通话。马斯克曾一直暗示要在该平台上增加音频和视频通话功能，作为让其成为“万能应用”的目标之一。马斯克最近表示这个功能将在 iOS、Android、Mac 和 PC 上可用，“不需要电话号码。” 目前还不清楚 X 是否已经广泛推出了这个音频和视频通话功能，或者非 Premium 用户是否可以使用该功能。

运行上千个量子比特的计算机制成【运行上千个量子比特的计算机制成】财联社10月26日电，据英国《新科学家》杂志网站24日报道，美国量子计算机制造商“原子计算”公司研制出了全球首台能运行1000个量子比特的量子计算机，打破了此前由IBM公司的“鱼鹰”创造的433个量子比特的纪录，这可能有助于提高量子计算机的精度。

6.5小时！神舟十七号成功对接空间站组合体 10月26日消息，据中国载人航天工程办公室消息，神舟十七号载人飞船入轨后，于北京时间2023年10月26日17时46分，成功对接于空间站天和核心舱前向端口，整个对接过程历时约6.5小时。按任务计划，3名航天员随后将从神舟十七号载人飞船进入空间站天和核心舱。神舟十六号航天员乘组已做好迎接神舟十七号航天员乘组进驻各项准备工作。据了解，北京时间2023年10月26日11时14分，搭载神舟十七号载人飞船的长征二号F遥十七运载火箭在酒泉卫星发射中心点火发射。约10分钟后，神舟十七号载人飞船与火箭成功分离，进入预定轨道，航天员乘组状态良好，发射取得圆满成功。在空间站工作生活期间，神舟十七号航天员乘组将进行多次出舱活动。开展涉及微重力基础物理、空间材料科学、空间生命科学、航天医学、航天技术等领域的大量空间科学实（试）验，完成舱内外设备安装、调试、维护维修等各项任务。 --- 本贴转自科普世界，驱动之家图：6.5小时！神舟十七号成功对接空间站组合体© 由科普世界提供

OpenAI估值飙升成为全球第三大最有价值初创公司划重点: - OpenAI预计估值800亿美元，成为全球第三最有价值初创公司。 - 该估值使其超越金融科技公司Stripe和时尚品牌Shein，仅次于TikTok的字节跳动和Elon Musk的SpaceX。 - OpenAI的成功吸引了投资，微软持有其49%的股份。 OpenAI估值预计将飙升至800亿美元，成为全球第三最有价值的初创公司。这一数据让OpenAI超越了金融科技公司Stripe和时尚品牌Shein，仅次于TikTok的字节跳动和Elon Musk的SpaceX。科技领域正在发生变革，巨头们开始寻求与初创公司合作，而不是将它们吞并。例如，亚马逊投资了Anthropic，微软则拥有OpenAI49%的股份。 OpenAI目前的估值为800亿美元，位列全球第三最有价值的初创公司，这是对人工智能潜力和实力的明证。科技领域的发展仍在以令人眼花缭乱的速度演进。此外，OpenAI一直在与投资者进行谈判，计划出售高达10亿美元的员工股份，以帮助员工分享公司的成功，同时也提高公司在工程人才市场中的竞争力。尽管全球初创公司的融资有所下降，但与人工智能相关的公司却蓬勃发展。投资者对人工智能的潜力充满信心，预见OpenAI及其同行有望成为未来的科技巨头。 OpenAI正处于高潮之中，计划从其明星产品ChatGPT中获得每年10亿美元的收入。而且，公司还在涉足人工智能芯片的研发，并引领着通用人工智能领域的发展。 --- 本贴转自站长之家（ChinaZ.com）

打卡 20231026 打卡打卡

微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全要点: 1. 微软、OpenAI等科技公司联合投入1000万美元，并任命Chris Meserole为“前沿模型论坛”的执行董事，以增强ChatGPT等生成式AI的安全。 2. “前沿模型论坛”由微软、OpenAI、谷歌和Anthropic创立，旨在推动前沿AI模型的安全和负责任开发，共设定了4大核心目标。 3. 成立了AI安全基金，用于支持独立研究人员构建健康、安全的AI生态，以应对生成式AI的潜在安全风险，同时签署了“AI安全承诺”。微软、OpenAI、谷歌和Anthropic宣布了一项重要举措，共同投入1000万美元用于增强生成式AI产品的安全。这个决定包括任命Chris Meserole为“前沿模型论坛”的执行董事，该论坛由上述公司联合创立，旨在确保前沿AI模型的安全和负责任开发。这反映了这些科技巨头对生成式AI安全的关切，也是他们签署的“AI安全承诺”的一部分，旨在推动生成式AI的健康发展。前沿模型论坛 © 由站长之家提供 “前沿模型论坛”的核心目标包括推进AI安全研究，降低风险，实现AI能力和安全性的独立评估，制定负责任的开发和部署最佳实践，与政策制定者、学者和社会合作分享关于信任和安全风险的知识，以及支持开发AI应用程序以解决社会挑战，如气候变化、癌症检测和网络威胁。 Chris Meserole将在“前沿模型论坛”中担任重要职务，推动AI安全研究，确定最佳实践，分享知识，以及支持解决社会问题的AI应用。他认为，强大的AI模型承载着巨大的社会责任，但为了实现其潜力，我们需要更好地了解如何安全开发和评估它们。为了解决生成式AI的潜在安全风险，微软、OpenAI、谷歌和Anthropic成立了AI安全基金，旨在支持来自世界各地的独立研究人员，共同构建健康、安全的AI生态。该基金的重点是支持开发新的模型评估技术，以帮助测试和确保前沿AI模型的安全性。这将有助于提高AI系统的安全标准，为整个行业和开发者提供更好的控制措施。这一举措凸显了科技公司对生成式AI安全的关切，并强调了他们对该领域的长期承诺。这将对生成式AI的未来发展产生积极影响，同时为全球提供更安全的AI解决方案。 --- 本文转载自站长之家（ChinaZ.com）

神舟十七号载人飞船发射升空据央视新闻直播报道，北京时间 10 月 26 日 11 时 13 分 59 秒，搭载神舟十七号载人飞船的长征二号 F 遥十七运载火箭在酒泉卫星发射中心点火发射。执行神舟十七号载人飞行任务的航天员乘组由汤洪波、唐胜杰、江新林 3 名航天员组成，汤洪波担任指令长。乘组包括 1 名第二批航天员和 2 名第三批航天员，是空间站建造任务启动以来，平均年龄最小的航天员乘组。此次任务是载人航天工程立项实施以来第 30 次飞行任务，也是第 12 次载人飞行任务，任务主要目的为：完成与神舟十六号乘组在轨轮换，驻留约 6 个月，开展空间科学与应用载荷在轨实（试）验，实施航天员出舱活动及载荷出舱，进行舱外载荷安装及空间站维护维修等工作，同时，持续评估空间站组合体功能性能，获取积累空间站运行的宝贵数据和经验，考核地面支持中心执行空间站运行管理任务的协调性、匹配性，进一步提升空间站运行效率和故障处置能力。按计划，神舟十七号载人飞船入轨后，将采用自主快速交会对接模式，约 6.5h 后对接于天和核心舱前向端口，形成三舱三船组合体。在轨驻留期间，神舟十七号航天员乘组将迎来天舟七号货运飞船、神舟十八号载人飞船的来访对接，计划于明年 4 月左右返回东风着陆场。神舟十六号航天员乘组在与神舟十七号航天员乘组完成在轨轮换任务后，瞄准本月 31 日返回东风着陆场。 --- 本帖转自IT之家图：神舟十七号载人飞船发射升空© 由 IT之家提供

智谱的AI作图质量和DallE比较哪个更好呢整体上看小智的绘画质量不比Dalle3差，从一个非专业人员角度看，我看不出有什么差别，视觉上场景的构建和渲染已经达到逼真效果。好吧那一张之前搬运的图，或者说在处理简单内容的作图的确没有差别，也许当处理某些细节的时候，才可能分辨出来，当画面包含复杂的元素，包括粒子，光线渐变，以及纹理等等。下面这张图是DallE3 宣传图，

他们利用ChatGPT将1.5万卢比的投资变成1亿卢比 🔍 划重点: 1. 两个创业者在数月内使用ChatGPT将1.5万卢比的投资变成1亿卢比 2. 他们开发了DimeADozen，一个用于测试商业创意的AI研究工具 3. 他们的AI工具在短时间内超越传统分析机构和搜索引擎，吸引了15，000美元的收购交易两个创业者Sal Aiello和Monica Power，在短短几个月内将1.5万卢比的投资变成了1亿卢比，而这一奇迹的背后是他们利用ChatGPT创建了一款AI工具DimeADozen。根据CNBC的报道，Sal Aiello是一家科技初创公司的首席技术官，而Monica Power则是一名产品设计师兼企业家。他们在硅谷初创公司孵化器Y Combinator组织的虚拟初创创始人见面会上相识。后来，他们决定利用人工智能来验证商业创意，并创造了名为DimeADozen的AI研究工具。这一工具允许创业者通过一个表单提交他们的想法，然后利用ChatGPT生成一份报告。DimeADozen这个产品的亮点包括: DimeADozen.ai 提供了使用人工智能来验证业务点子的能力，帮助创业者节省宝贵的时间，做出明智的决策。这可以帮助创业者确定是否需要调整他们的业务点子，以及是否值得投资。该产品提供了关于如何进行市场研究、推出和扩大业务以及筹集资本的信息。这为创业者提供了全面的指导，以在创业过程中取得成功。 DimeADozen.ai 声称具有数十年的商业经验和GPT-4的能力，可以在创业之前帮助小型企业了解市场和客户，从而降低了新业务的风险。这款AI工具的性能已被证明优于传统分析机构和搜索引擎，而且速度惊人。Felipe Arosemena和Danielle de Corneille是一对夫妻，他们看到了这一AI工具的潜力，以15，000美元的价格收购了这个业务。交易完成后，Arosemena和Corneille成为了这个创业公司的新老板，而Aiello和Power则继续担任公司顾问。 --- 本贴转自站长之家（ChinaZ.com）图：DimeADozen © 由站长之家提供

开源版「ChatGPT Plus」来了，能做数据分析、插件调用、联网机器之心编辑部基于此，来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents，并开源了全栈代码（完整前后端，研究代码），以满足从研究者到开发者再到用户的所有人的需要。 OpenAgents 用基于「大语言模型」（LLMs）的技术和全栈工程代码尝试近似复刻了 ChatGPT Plus 的功能。智能体能执行 Python/SQL 代码，熟练调用工具，也能上网找地图发帖子，一路从研究代码实现到后端前端，让其变成了人人都能用的落地级别应用。OpenAgents 完整披露了他们采用的技术和遇到的困难，完全开源了代码，包含从科研到逻辑代码到前端代码的一切。代码完善、易于拓展，本地直接可以一键部署，配套提供了含有丰富的使用案例的文档，帮助研究者和开发者在模型上搭建自己的智能体和应用。OpenAgents 总览图，面向用户的网页界面，面向开发者的本地部署，面向研究者的语言智能体。代码链接：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Fxlang-ai%2FOpenAgents&urlrefer=c4ba0a4d57241c238d548a51e03ff8f7 论文链接：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Farxiv.org%2Fabs%2F2310.10634&urlrefer=a015de1632f1d32e9eebcc895cc4962e Demo 链接：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fchat.xlang.ai%2F&urlrefer=9354c76258125c49284e22d5974028ad 文档链接：http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fdocs.xlang.ai%2F&urlrefer=ab10b999b13a36fae2e23fa2d1337151 与 ChatGPT Plus 的 “一样” 和 “不一样” 左边是 OpenAgents 的实现，右边是 ChatGPT Plus:先来看看「数据分析」功能。同一个分析股票价格的任务，OpenAgents 和 ChatGPT 都能不错地完成用户对股价和交易的分析要求。不过 OpenAgents 可以自动搜索 Kaggle 数据集并下载，ChatGPT 需要用户从本地上传。再试试 OpenAI 最早推出的「插件」功能。用户想要画一些八面体，两者都成功调用了 Wolfram 插件画出多种八面体的图片。最后看看「网页浏览」。用户想要查询 10 月 20 日从中国香港到纽约的机票，OpenAgents 识别用户意图后直接跳转到 Skycanner，像 “真人” 一样一边思考一边在网站中填入信息，最后回到聊天页面总结信息；而 ChatGPT 处于安全考虑保证可控性，和调用插件类似，在云端做网页浏览，将最后搜寻到的信息返回。由于 OpenAgents 提供了开源的代码，开发者和研究者可以定制，若干行代码适配自己想要的模型，改进、创造自己想要的功能，甚至创造新的 Agent。这对于该方向的进一步开展开发和研究至关重要。看似简单，「生产力能用」的智能体为什么踩坑这么多？智能体的开源框架不少，基于大模型的中间件更是层出不穷，为什么搭建一个真正方便可用的智能体并不容易，OpenAgents 在他们论文中与其他智能体框架进行了对比：对比 OpenAgents 和其他的框架。从表格中可以看出，「界面」(Interface) 和「配套环境」(Environment) 是 OpenAgents 与众不同的两个因素。现有的开源框架比如 LangChain，AutoGPT 和 BabyAGI 等旨在为开发者提供早期概念验证实现和控制台界面，但在真实世界中却不够鲁棒，这限制了更广泛受众的接入，特别是那些不熟悉编程或控制台的普通用户。而在闭源体系中，OpenAI 在 ChatGPT Plus 中部署了精心设计的产品，尤其是高级数据分析（之前称为代码解释器）、插件和 Bing 浏览等功能，利用进一步训练的模型、业务逻辑代码和培育的软件社区（例如，插件商店）。但是闭源导致它们难以作为开发和研究平台使用，社区无法站在巨人肩膀上探索、评估和改进。在侧重考量这些维度之后，OpenAgents 作为面向真实场景的开源 Agent 框架，为社区提供了一个可与 ChatGPT Plus 一较高下的平台。在「界面」上，OpenAgents 提供线上的网页 demo (以及配套的开源代码)，非程序员背景的普通用户也可轻松与智能体进行交互，而之前的工作通常不提供或者以「控制台指令界面」(CLI) 形式提供交互，极大地提高了智能体的使用门槛。在「配套环境」上，OpenAgents 支持真实世界环境和可控环境，支持超过 200 + 的日常工具调用，支持网页自动浏览。这些功能侧重和配备使得 OpenAgents 成为对于普通用户最没有门槛的选择；也为研究、开发人员等提供可能是最好的直接面向用户的机会。作为生产力的 Agent 未来的第一步：「用户」,「开发人员」,「研究人员」都能用的 Agent 平台为了解决上述问题，OpenAgents 的动机是作为一个开源平台，为使用和部署智能体提供，目前包括三个关键智能体：用于 Python 和 SQL 的数据智能体； 200 多个工具使用的插件智能体；自动网络浏览的 Web 智能体。 OpenAgents 相信，为了让大语言模型发挥其全部潜力，它们必须从纯粹的理论或面向开发者的工具转变为为广泛用户群提供的动态、交互式系统。「普通用户」可以通过在线 Web UI 轻松探索智能体功能，无需编码专业知识。此外，OpenAgents 为「开发者」提供完整的业务逻辑和研究代码，以便在本地轻松部署，「研究人员」可以进一步构建语言智能体。最后，OpenAgents 旨在成为一个真实而全面的人类可交互的智能体评估平台：根据真实需求，真实用户与智能体互动以完成其任务，并记录整个用户 - 智能体互动过程和用户反馈以供进一步评估。与现有的基准测试和平台相比，OpenAgents 提供了一个真实环境，智能体可以满足各种真实的用户需求。面临和克服的挑战挑战 1: 基于提示来构建真实世界语言模型的弊端在为真实用户构建基于提示的应用程序时，使用提示中的指令来设定特定要求。这些指令有不同目的，有一些是为了确保大语言模型的输出符合后端逻辑处理的特定格式（以特定键的字典形式输出）；有一些是提升输出的美观度（尽可能一条条单独列出项目）；有一些是用于防止潜在的攻击（拒绝用户恶意构造的无限循环程序并且执行）。这些带着约束目的提示来约束语言模型需要开发者研究者反复调试出来一些可以使用的指令，这些指令加在一起通常会是几百个「词元」（token）甚至上千个词元，这些指令作为前缀会被反复输入到模型造成显卡资源的大量消耗；另外一方面，词元越多越依赖 LLM 有很好的性能，所以说这一条技术路线对大语言模型的指令跟踪能力和支持的上下文长度提出了一定的要求。当前的开源模型在这些方面已经取得了显著的改进，但是在实验中仍然是不足以用来实际使用的，这方向的研究还可以继续。此外，需要更加重视智能体模型的基础开发和研究，以及针对特定领域和要求训练专用的智能体模型。这种方法可能比仅依赖于提示一个通用强大但固定模型更高效，也更可控。挑战 2: 无法控制的现实因素实现真实世界的语言智需要面对很多无法控制的现实因素，这些因素包括用户行为、互联网的基础设施和业务逻辑等，它们在过去的研究中并未得到充分建模。这就需要重新评估，甚至推翻许多过去研究中的假设和方法。必须考虑到的事是，调用的 API 所在的服务器可能会崩溃。这种情况需要监控并稳定地完成用户命令，而不是像过去的工具使用研究中所假设的那样。在生成回复的过程中，用户可能会感到不满意，这可能导致语言模型在生成过程中被中断。此外，像 CAPTCHA 弹出或广告改变网页这样的不可预测事件，可能会在相对稳定的网页结构中引入一定程度的随机性，这在以前的自动浏览网页的工作中未曾考虑过。诸如此类的问题还有很多，比如说在智能体反应和思考的时间内（现在往往需要数秒）就改变的环境，等等。挑战 3: 来自真实场景的额外指标具体的研究通常过于强调性能指标，而忽视了现实场景中的基本需求。例如，使用流式（即每生成一个词元都尽快显示给用户）可以让用户能够快速感知系统的反馈，而无需等待长篇大论的文本生成完毕再一起看到。特意设计的提示可以让智能体的回复格式更加美观，这对用户体验有着显著影响。然而，现有的方法并未充分考虑这些影响。导致了尽管在准确性上的性能指标优秀，但在实际应用中，它们可能导致响应时间过长、文本可读性差等等导致用户体验不佳的问题，接下来的研究需要进一步考虑性能和用户体验之间的权衡问题。挑战 4: 由系统问题引发的评估复杂性构建直接针对应用程序的智能体可以满足更多用户需求，同时也能揭示更多评估挑战。但基于 LLM 的应用程序构建会带来额外的复杂性，使得难以判断失败案例是来源于 LLM 应用的限制还是逻辑代码的不足。举例说明，如果说一个用户因为没法从界面中直接拖拽上传文件而造成没有完成用户想要的操作而判断智能体能力不行是不合理的。因此，对智能体设计和操作逻辑的系统进行改进，简化智能体流程以及用户使用逻辑，或者构建一个更加完善的设计和实现逻辑，是有前景且必要的。未来展望 OpenAgents 可以怎么样帮助社区做下一步的研究和开发？在他们的构想中至少有如下几点：未来工作 1: 搭建更多智能体应用 OpenAgents 打通了一套完整的应用级语言智能体开发流程以及所需要的技术，并且开放了代码。这为其他创新应用与终端用户提供了可能。开发者们可以基于此开发任何自己想要的新应用，比如说多模态对话、语音对话、库级别代码助手等。未来工作 2: 工具和组件集成 OpenAgents 致力于探索和解决构建实用级智能体应用的基本需求，为社区提供了一个强大的基础，使得社区可以轻松地通过集成其他组件进行水平扩展。同时，还可以扩展更多的基础模型，比如最近的大型多模态模型，以及适应新的 UI 设计等。未来工作 3: 人机交互领域研究开发者和研究者基于 OpenAgents 平台能轻松构建基于大语言模型的新智能体应用程序。OpenAgents 因此能帮助构建应用程序演示，供人机交互（HCI）研究人员深入研究更直观、更用户友好的界面设计。这将提升用户的参与度和满意度。未来工作 4: 自适应用户界面生成自动创建用户界面是一个有趣且具有挑战性的领域。这些界面能根据特定标准，如用户的设备、偏好或上下文，进行自我调整或定制。研究人员可以深入研究在基于 OpenAgents 的自适应 UI 中，如何应用大语言模型，以及它们对用户体验的影响。未来工作 5: 大语言模型在实际应用场景下的评估为大语言模型建立公正且稳健的评估方法，对于公平评价其能力和性能至关重要。目前，通过使用预先收集的数据和受控环境，对智能体进行基准测试。虽然这些评估非常关键，但它们往往无法全面反映真实世界中的动态挑战。鼓励社区对这些评估指标和平台进行扩展或完善，这将显著推动该领域的发展，并为大语言模型的实际性能和能力提供更准确的评估和洞察。 --- 本文转自易有料，机器之心Pro