LearnerForever
LearnerForever
永远是你们的小吧,也希望吧友们开心快乐每一天。
关注数: 1,483
粉丝数: 2,228
发帖数: 25,743
关注贴吧数: 58
全球AI音乐会,第一次听见中国声音 盛夏将至,各条AI赛道也热烈了起来。如果评选一下,近段时间哪个领域的AI应用最为火爆,那么AI音乐创作绝对名列前茅。 一个月之前,海外初创企业Suno发布新版AI音乐生成大模型Suno V3,它可以根据用户自然语言快速生成相关风格音乐,在全球范围内引发热议。而就在不久前,来自前DeepMind团队成员的Udio音乐大模型发布。这款模型可以带来非常逼真的音乐制作效果,并且可以完成多段式、长音乐作品的生成。 AI音乐生成大模型赛道,竞争突然激烈了起来。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等项目,我们似乎在今年迎来了一场全球AI音乐会。一时间异彩纷呈,好不热闹。但在这场AI音乐会中,有一个现象非常值得重视:这一次,中国科技与全球前沿AI趋势之间没有时差,无缝衔接。我们不再是跟随者与追赶者,而是第一时间加入了这场音乐与AI的盛宴,奏响了属于自己的旋律。 4月2日,由昆仑万维打造的AI音乐生成大模型“天工SkyMusic”开启免费邀测,4月17日更是正式发布。 天工SkyMusic是国内唯一公开可用的AI音乐生成大模型,也是中国首个音乐SOTA模型。 它与震撼全球科技与音乐产业的Suno、Udio保持了时间线上的高度同步,同时多个领域的技术能力更加出色。在与Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐最新SOTA模型。“中国AI不缺席”,是一段我们期待了很久的旋律。究竟是什么让昆仑万维能够完成这次演奏?天工SkyMusic,以及背后的天工3.0有着怎样的产业与社会价值? 让我们打开这场全球AI音乐会,听懂一首关于“中国AI不缺席”的盛夏奏鸣曲。 --- 本帖转自环球老虎财经专栏
【推广专帖】单独发广告推广帖将予以删除 广告的单独发帖规定已经试运行一段时间了,决定开设推广体验专帖(以下称为“本专帖”)。 在此声明,对于广告帖,以下链接中的规定的试运行期将持续到4月30日(相关帖子将在4月末删除),之后采用新规(新规将在下文中详细描述)。 https://tieba.baidu.com/p/8798885465?&share=9105&fr=sharewise&is_video=false&unique=3133BE53723B26A690B1395D25A1112F&st=1702779945&client_type=1&client_version=12.51.1.0&sfc=copy&share_from=comment&red_tag=1637844328 新规产生的背景: 目前贴吧里,有些内容明显是以推广、盈利为主,占据了很大一部分篇幅,虽然这些推广帖也有其合法存在的权益,chatgpt吧一直坚守着吧友的发帖自由的原则,但过多的广告内容可能会影响到吧友们正常交流,因此决定开设“本专帖”,目的是统一集中管理,避免存在大量广告影响帖吧质量。 - 对于广告,推广帖,请大家自觉遵守以下新规。新规内容: 1. 【广告】内容发帖: 所有第三方推广体验,广告等性质的帖子,只允许在“本专帖”内回复,单独开设主题发布将予以删除。 2. 【广告】内容回复: 所有推广体验,广告等性质的回复帖,只允许在“本专帖”内回复,交流帖内禁止回复广告。 3. 【推广体验区】变更为【使用体验区】,更改后该区的帖子不可以包含任何推广、广告性质内容,但可以是使用体验和分享的内容。 4. 非广告帖子内交流: 任何非广告性质的主题帖内禁止回复任何广告内容。 新规特别说明: - 本规定将于5月1日 00:00:00起开始施行,试运行期为一个月。 - 本规定是鼓励吧友们多分享、交流与AI技术相关的经验和观点,贴合ChatGPT吧主题,让贴吧内容更加多元化,满足不同吧友的需求。 👮对不按规定、单独发广告内容的,不实信息等一律删除处理,多次违规,将予以封禁,严重将拉黑。 请自觉遵守,以获得更好的交流体验。 📝 此规定目的: 1. 集中管理推广体验,广告等,最大程度上减少对其他吧友的影响 2. 避免夸张的宣传,诱导吧友进行不合理的消费,导致权益受损 3. 规范贴吧发贴准则,提高帖吧主题帖质量,坚守吧友发贴自由原则,维护贴吧健康交流环境 - 正如之前提到的,我们必须面对一个 平衡的问题,特别是对于【广告】,【推广】,【拼车】贴。理解我们有一部分吧友们对于大量广告内容的担忧,希望吧内能有更多关于AI技术的交流与分享的主题帖。 --- 通过不断调整吧规并实施新规的试运行,积极引导并希望能与吧友们共同努力,共创一个和谐、友善的吧内环境。我们期待通过这种方式,逐步完善chatgpt吧的发帖交流规则,确保每位吧友都能在这里获得更好的交流体验。 希望吧友们理解并支持这些变化,共同维护一个健康、有序的交流社区。 感谢吧友们的理解与支持! 如有对此新规有任何异议和意见,请随时留言回复。 chatgpt吧吧务
“AI大战”全力以赴?谷歌再出招:重组团队加快产品创建! 谷歌母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)周四表示,谷歌正在对其人工智能(AI)团队进行结构性改革,并称此举将有助于公司更快、更有效地开发人工智能产品和服务。为了加快谷歌AI模型(Gemini和Gemma)的研发工作,皮查伊在周四发给员工的一份通知中表示,构建模型、研究和负责任的人工智能团队将被整合谷歌DeepMind之下。这将把上述部门的员工联合到一个团队,也将把训练和构建这些系统所需的昂贵计算能力整合到一个部门。“这些工作会扩大公司的能力,为用户、合作伙伴和客户提供强大的人工智能。我很高兴能在下周四的财报电话会议上展示更多进展。”他说。与此同时,皮查伊还表示,一个新的统一平台和设备团队将把谷歌硬件、软件和人工智能团队的努力整合在一起,包括那些致力于安卓、Chrome、搜索和照片等产品的团队。 此外,该团队还将包括从事计算摄影和设备上人工智能功能的员工,比如谷歌最近与三星电子(Samsung Electronics Co.)合作推出的“圈选搜索”(Circle to Search)人工智能工具。 皮查伊写道,这些变化“将帮助我们更专注、更清晰地实现我们的使命。” 全力应战 自从加入这场AI竞赛,谷歌先是不断完善其在生成式人工智能方面的工作,以赶上微软和OpenAI的联合努力。与此同时,该公司也一直在改变工作重点——降低成本。在过去的几个月里,这导致了一系列的裁员。 今年1月,该公司裁减了数字助理、硬件和工程团队的数百名员工。周三,谷歌又表示正在裁员,但没有透露具体规模,只是强调此次裁员并非全公司范围内。 谷歌发言人指出,从2023年下半年到2024年,谷歌的许多团队进行了变革,以提高效率、消除层级并将资源集中到最重要的产品之中。 谷歌表示,为了更加专注于推出人工智能工具和服务,此次重组是必要的。而谷歌努力的成果也是显而易见的:今年早些时候,该公司推出了其功能强大的人工智能模型Gemini 1.5 Pro的新版本。 该公司表示,与竞争对手相比,它可以处理更多的文本、视频甚至音频输出。它还将其聊天机器人重新命名为Gemini,并发布了一个更开放的大型语言模型,以帮助公司赢得开源社区的青睐。 但谷歌也面临着挑战与非议。因此周四,皮查伊还宣布了一个信任和安全团队(Trust and Safety team),该团队将更多地投资于人工智能系统的测试和评估。此举似乎旨在通过将责任集中在一个团队身上,解决推出面向消费者的人工智能产品所带来的风险。
联想TechWorld 2024:AI PC时代的新篇章 联想TechWorld 2024在上海举行,吸引了众多关注者的目光。这次大会聚焦于人工智能时代下的个人计算机(PC)的演变,探讨了联想在这一领域的创新之路。随着苹果计划将Mac产品线纳入人工智能改造的窗口期临近,人们纷纷猜测联想是否有机会率先推出创新性产品,抢占市场先机。同时,作为英伟达的重要合作伙伴,联想在AI领域又将有何作为? 联想总裁杨元庆在发布会上指出,人工智能不是要取代人类,而是要为人类服务,增强人类的智能。他强调了AI时代的新格局,并将PC定位为AI个性化计算机,承载着个人数据和AI能力的连接点。 据ITBEAR科技资讯了解,联想发布了内嵌个性化AI智能体“联想小天”的AI PC系列产品,用户可以通过自然语言与之交互,并享受个性化服务。这些产品在发布当日开启预购,但门店体验和全网发售将于下月进行。 联想展示了AI PC的多种应用场景,包括通过自然语言识别进行照片搜索,以及在平板上生成素材和合成图片等。这些功能为用户提供了更便捷、智能的计算体验。 此外,联想还推出了价格从8499元到17999元不等的YOGA系列AI PC产品,其中YOGA Book 9i以其独特的双屏幕设计备受关注。这款产品专为AI应用而设计,用户可在下屏幕输入内容,而上屏幕则显示AI生成的效果,提高了学习和创作的效率。 联想在AI基础设施领域也取得了创新成果,包括算力匹配魔方、内核态虚拟化算法、集合通信算法库、AI高效断点续训技术和AI与HPC的异构集群超级调度器等。这些技术创新为AI 2.0时代的发展提供了有力支撑。 针对企业用户,联想推出了面向不同行业的智能体解决方案服务体系“一擎三箭”,通过与合作伙伴共同打造定制化的智能体解决方案,为企业客户提供更智能、高效的服务。 联想在本次TechWorld 2024上展示了在人工智能时代的创新成果和发展方向。他们的AI PC产品和AI基础设施创新为用户带来了全新的体验,也为企业客户提供了更多智能化的解决方案。
人工智能机器人离我们有多远 你是否曾经惊异于科幻电影中的那些人工智能?又或者是被最新研究成果或产品所震撼?这些机器人时而深怀情感,时而超乎人类理解的聪明才智让我们俱怀敬畏。人工智能的发展,已经逐渐由屏幕上的影像走入我们的现实,让我们一同揭开这场科技的巨变向我们展示的过去与未来。 人工智能的产生,可以追朔到1949年赫布提出的学习规则和权值概念。然后在1950年,图灵提出图灵测试概念,为人工智能建立了思考的基础。进入1956年,人工智能这个概念在达特茅斯会议中被正式提出,被誉为人工智能元年。人工智能的奠基人购包括大名鼎鼎的"计算机科学之父"图灵、信息论创始人香农、诺贝尔经济学奖得主赫伯特·西蒙等众多贡献者。然而,人工智能的发展却遭遇起伏。由于算法问题和研究瓶颈,加上明斯基对其局限性的批评,人工智能一度陷入低谷。但科技的发展永不止步,人工智能也终于有所复苏。20世纪70年代中期,称之为专家系统的AI程序开始应用于公司,引领人工智能进入了“知识期”。而随着决策树算法以及支持向量机的提出,人工智能开始蓄势起飞,成为研究的新热点。当然,人工智能是前进的,也是演化的。Hinton在2006年提出的深度学习,以及Yann LeCun的卷积神经网络,使得人工智能的将更多的可能变为现实。如今,无论是语音识别、图像检测,还是药物发现、基因组学,人工智能的多元发展都有着深远的影响。亮点闪烁的人工智能的发展,早已从电影萤幕上的科幻,变为了触手可及的现实。它将改变我们的生活,也会影响未来的世界。在这个过程中,我们是否会遇到机器人篮子,是否会像《终结者》中那样对战机器人,谁知道呢?但我们明确的是,我们期盼和憧憬未来,也希望人工智能能带给我们更美好的生活。 --- (一览AI原创)
通义千问开源基于Qwen1.5的代码模型CodeQwen1.5 通义千问昨晚开源了基于Qwen1.5的代码模型CodeQwen1.5,这是一个基于 Qwen 语言模型的代码专家模型。CodeQwen1.5拥有7B 参数,采用 GQA 架构,经过约3T tokens 代码数据的预训练,支持92种编程语言,并且能够处理最长64K 的上下文输入。 在代码生成、长序列建模、代码修改和 SQL 能力等方面,CodeQwen1.5展现出了卓越的性能,极大地提升了开发人员的工作效率,并简化了软件开发流程。在代码生成方面,CodeQwen1.5已经超越了许多更大尺寸的模型,缩小了开源 CodeLLM 与 GPT-4之间在编码能力上的差距。通过 HumanEval 和 MBPP 的评估,CodeQwen1.5在各项指标上均表现出色。 此外,LiveCodeBench 的评估显示,CodeQwen1.5在 LeetCode、AtCoder 和 CodeForces 三个竞赛平台的问题上具有极强的泛化能力,尽管其预训练语料中包含了 LeetCode 的数据。 CodeQwen1.5不仅精通 Python,还支持多种编程语言。在 MultiPL-E 的8种主流语言上进行全面评估,CodeQwen1.5证明了其多语言编程的卓越能力。长序列能力对于代码模型至关重要,CodeQwen1.5通过精心构造的长序列代码数据预训练,实现了最长64K 输入长度的支持。 在实际应用方面,CodeQwen1.5在 SWE Bench 上的表现尤为突出,它能够理解代码仓库并生成可通过单测的代码,解决了真实软件开发中的问题。 CodeQwen1.5在代码修改方面的能力也得到了验证,它在 CodeEditorBench 的四个方面——Debug、Translate、Switch、Polish——均达到了最佳效果。 作为一个智能的 SQL 专家,CodeQwen1.5通过自然语言查询数据库,极大地降低了非编程专业人士与高效数据交互之间的学习曲线。在 Spider 和 Bird 两个流行的文本到 SQL 基准测试中,CodeQwen1.5的性能接近 GPT-4,显示了其在 SQL 领域的强大实力。 CodeQwen1.5作为 Qwen1.5开源家族的一员,目前已支持多种平台和工具,如 Transformers, vLLM, llama.cpp, Ollama 等。开源社区对 CodeQwen1.5的发布充满期待,希望它在代码助手、Code Agent 等方面为社区做出贡献,并在未来的代码智能建设中发挥重要作用,实现真正的 AI 程序员。 详细模型介绍:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fqwenlm.github.io%2Fzh%2Fblog%2Fcodeqwen1.5%2F&urlrefer=6c00b8503f2eb9a11e01c140daeb289b
国家网信办:确认 117个 AI 大模型通过国家备案 消息:国家互联网信息办公室近日发布了《生成式人工智能服务已备案信息的公告》,根据公告文档,目前确认了117个 AI 大模型已通过备案程序。这一举措旨在促进生成式人工智能服务的创新发展和规范应用。根据公告,这些模型已经符合了《生成式人工智能服务管理暂行办法》的要求,并且可以在中国境内合法应用。备案确认的117个 AI 大模型的范围涵盖了多个领域和应用场景,从语言模型到图像生成,都有不同程度的覆盖。这一消息对于人工智能领域的发展具有重要意义,意味着这些模型在技术和法律层面都已经得到了认可,可以更加稳健地推进相关应用的落地和发展。 根据规定,已上线的生成式人工智能应用或功能需要在显著位置或产品详情页面公示所使用的备案信息,包括模型名称及备案号。这一举措旨在增加信息透明度,方便用户了解所使用的人工智能服务的来源和合法性。同时,也有助于监管部门对人工智能应用的监督和管理。国家互联网信息办公室关于发布生成式人工智能服务已备案信息的公告_中央网络安全和信息化委员会办公室 (cac.gov.cn) http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.cac.gov.cn%2F2024-04%2F02%2Fc_1713729983803145.htm&urlrefer=778e0a4dd09e3aef2f94bafbe2f6ebcc
OpenAI、谷歌等联合编制的大模型安全国际标准正式发布 4月15日-19日,第27届联合国科技大会在瑞士日内瓦召开。16日,在以“塑造AI的未来”为主题的AI边会上,世界数字技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。 据了解,这两项国际标准是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成。其中《大语言模型安全测试方法》由蚂蚁集团牵头编制。(图:WDTA发布大模型安全国际标准,OpenAI、蚂蚁集团、科大讯飞等参编) 与会的WDTA人工智能安全可信负责任工作组组长黄连金表示,随着人工智能系统,特别是大语言模型继续成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。此次发布的标准汇集了全球AI安全领域的专家智慧,填补了大语言模型和生成式AI应用方面安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强公众信任。 世界数字技术院(WDTA)是在日内瓦注册的国际非政府组织,遵从联合国指导框架,致力于在全球范围内推进数字技术,促进国际合作。AI STR(安全、可信、负责任)计划是WDTA的核心倡议,旨在确保人工智能系统的安全性、可信性和责任性。蚂蚁集团、华为、科大讯飞、国际数据空间协会(IDSA)、弗劳恩霍夫研究所、中国电子等均为其成员单位。 近年来,世界各国都在加强对于大模型安全的研究和管控。我国先后发布了《全球人工智能治理倡议》《生成式人工智能服务管理暂行办法》《生成式人工智能服务安全基本要求》等,旨在促进生成式人工智能安全可信发展,推进全球人工智能治理领域合作共识。 信息显示,此次发布的两项国际标准是大模型及生成式AI应用方面的安全测试标准。 其中,《生成式人工智能应用安全测试标准》由WDTA作为牵头单位。该标准为测试和验证生成式AI应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。它定义了人工智能应用程序架构每一层的测试和验证范围,包括基础模型选择、嵌入和矢量数据库、RAG或检索增强生成、AI应用运行时安全等等,确保AI应用各个方面都经过严格的安全性和合规性评估,保障其在整个生命周期内免受威胁和漏洞侵害。 《大语言模型安全测试方法》由蚂蚁集团作为牵头单位。该标准则为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。它提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并率先给出了四种不同攻击强度的攻击手法分类标准,提供了严格的评估指标和测试程序等,可解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力,使开发人员和组织能够识别和缓解潜在漏洞,并最终提高使用大语言模型构建的人工智能系统的安全性和可靠性。(图:蚂蚁集团王维强作为标准参与单位代表,在会上发言) 作为标准参与单位代表,蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强受邀参会并进行了发言。他表示,生成式AI将释放巨大的生产力,但也要对它带来的新风险高度警惕。大型科技公司应在促进生成式AI安全和负责任的发展中发挥关键作用,利用其资源、专业知识和影响力推动最佳实践,构建一个优先考虑安全、隐私和道德考量的生态系统。例如,通过制定行业标准与指南,为开发和部署生成式AI系统的开发者和机构提供清晰指导;投入研发并开放保障生成式AI安全的工具,形成产业共治。 公开资料显示,蚂蚁集团从2015年起就积极投入可信AI技术研究,目前已建立了大模型综合安全治理体系。蚂蚁集团还自研了业界首个大模型安全一体化解决方案“蚁天鉴”,用于AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”AI安全检测体系的应用实践,与全球生态伙伴交流编制。此外,蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险,公司所有AI产品均需通过科技伦理评测机制,确保AI安全可信。
Intel、微软联合定义AI PC:必须有Copilot实体按键 AI PC方兴未艾,但对于究竟什么是AI PC,还没有统一的行业标准,各家都在倡导自己的概念。 Intel、AMD作为平台级厂商都认为必须同时具备CPU、GPU、NPU才能叫AI PC,NVIDIA作为显卡巨头则强调RTX GPU才是AI PC的灵魂。其实,微软对于AI PC也有发言权,毕竟AI体验要真正落地,离不开操作系统层面的支持和优化。 在中国台北举办的一场AI PC峰会上,Intel抛出了与微软联合定义的对一台AI PC的要求:一方面是配备包含全新NPU、GPU、CPU的处理器芯片,比如说Intel的酷睿Ultra(当然还有AMD的锐龙7040/8040系列)。 另一方面则是要支持微软Copilot,并配备Copilot实体按键。 第一点没啥可说的,第二点就有点麻烦了,主要是在国内比较特殊,无法通过常规方法使用Copilot。 或许,未来微软会通过特殊的方法将Copilot带入中国,比如开发定制版本,比如与国内厂商合作定制,但短时间内肯定不行,也会造成割裂。 更何况,现有的AI PC都没有配备Copilot按键,难道它们都不是真正的AI PC? 或许,这是微软对于未来AI PC的定义吧。当然了,现阶段的当务之急是推动更多的厂商、开发者投入AI PC,带来更多的产品、更多的应用。 为此,Intel去年10月就发起了AI PC加速计划,现在又进行了两大升级,一是增加AI PC开发者计划,二是吸纳独立硬件开发商加入。 根据AI PC开发者计划,Intel将向开发者提供丰富的支持资源,包括OpenVINO、ONNX Runtime、DirectML、WebNN等框架和库,AI工具、工作流、代码示例和用例等辅助工具,针对Intel XPU优化的AI模型,硬件开发工具包,文档、培训、技术博客等一站式知识中心。 其中,AI PC开发工具包目前提供一台已经AI Ready的华硕NUC Pro 14迷你机,硬件上采用酷睿Ultra处理器,提供四个USB 3.2和两个雷电4接口,最多可扩展四台显示器、96GB内存,不存在性能瓶颈。 软件上则预装了AI堆栈、XPU驱动程序,以及完整的开发环境。对于IHV独立硬件开发者的支持方面,Intel在中国大陆、中国台湾和美国三地提供开放实验室支持,24/7全天候提供资源和早期参考硬件的访问。 在试点阶段,就已经有100多家IHV厂商开发了200多个适配AI PC的组件,后续还会大幅增加和优化、增强。 比如说屏幕,最好是OLED,更省电,也可以支持更低的刷新率。 比如摄像头,要提供高质量的图像和视频。 比如内存和存储,要针对AI PC平台进行优化,大模型对这方面的要求有了明显提高。 比如视觉传感,要集齐人脸识别、手势操作、用户姿势、人眼跟踪等因素,这都是AI体验不可或缺的基础。 虽然这些都还不是强制要求,但或许在未来,Intel会打造一个AI PC的硬件标准与体验认证,就像现在的Intel Evo严苛认证。目前,行业内已经有100多家ISV独立软件开发商参与AI PC的优化,今年内将会实现300多个AI加速的软件功能。 预计到2025年,全球将有超过1亿台AI PC。
微软新定义的Copilot键:左Ctrl+Win+F23 微软将为即将推出的人工智能 PC 产品推出官方 Copilot 键。细究其功能,新按键的操作类似于上世纪 80 年代的键盘组合。微软将 Windows 11 PC 的Copilot 键描述为一种协助用户的手段,使他们能够轻松拥抱即将到来的人工智能"变革"。这个新键将很快成为 Windows 键盘配置的标准配置,新发布的笔记本电脑已经配备了这个额外的键盘功能。 Tom's Hardware 获得了几台配备新按键的戴尔新笔记本电脑(XPS 14 和 XPS 16),并决定对它们进行测试。Copilot 键的设计目的是打开 Windows Copilot 聊天机器人功能,但只要有适当的软件,就可以对它进行重新编程,以完成不同的任务或模拟不同的组合键。 汤姆使用了AutoHotkey,这是一款著名的宏脚本和自动化工具,也可用于记录按键及其产生的扫描码。扫描码是大多数电脑键盘在按键后向电脑发送的数据,可让 Windows 响应最合适的操作,如打开文件资源管理器或前面提到的 Copilot 聊天机器人。 根据 AutoHotkey 日志,Windows 将 Copilot 键解释为以下三个键的组合:左 Ctrl、Windows 键和 F23。F23 功能键通常不出现在现代键盘布局中,在传统的全尺寸键盘设计中通常最多包含 12 个功能键。 双功能键行可用于较旧的键盘型号,尤其是用于与大型主机或大型计算机设备交互的键盘。1985 年推出的 IBM Model M 122 键盘就采用了这种配置。这发生在 2005 年 IBM 决定将其业务出售给联想从而退出个人电脑市场的几年前。上世纪 90 年代,带有 122 个按键的键盘仍在销售,而 Windows 的程序设计甚至至今仍能适应这种老式设计。操作系统可以轻松管理属于额外功能键的扫描码。微软之所以为 Copilot 选择这种"奇特"的组合键,可能是因为如果不这样做,就不太可能有人需要同时按下这三个键。 既然我们已经了解了 Copilot 键的功能,那么在"非人工智能"电脑上定制该功能将变得更加容易。Tom's Hardware 建议使用快速的 AutoHotkey 脚本,在每次启动 Windows 11 时覆盖微软的官方组合键,让 Copilot 键执行更有用的任务,如打开应用程序、输入文本字符串或启动网站。
微软对 OpenAI 巨额投资据悉不会遭到欧盟调查 据财联社报道,微软公司对 OpenAI 公司 130 亿美元的投资将避免受到欧盟兼并监管机构的正式调查,从而平息了人们对双方关系可能被迫破裂的担忧。 知情人士透露,欧盟委员会已经决定,这一合作不值得进行正式调查,因为不属于收购,而且微软并不控制 OpenAI 的发展方向。 微软引用了之前的一份声明,强调与 OpenAI 的合作促进了创新和竞争,同时保持了两家公司的独立性。欧盟委员会发言人强调,要解决任何竞争问题,都需要确定两家公司之间控制权的永久变更。
iOS 17.5 Beta 2 来了,除了开放侧载,还暗示了 Pencil 3 的新功 距离上次更新 14 天后,苹果现在又推送了 iOS 17.5 Beta 2 版本更新。 根据苹果开发者官网的公告,相比于 iOS 17.5 Beta 1 版本,这次的大多数更新可以说是「小修小补」: 电池健康设置选项优化。 新增备忘录自动标签功能提示。 阅读、播客等 App 细节优化。 SDK 和一些细节 BUG 的修复。 不过,这次更新的重头戏还在后面。苹果带来了令人期待已久的功能:通过网页分发 App。▲ iOS 侧载预览,图片来源:ZOLLOTECH 想要通过网站分发 App 下载的开发者,需要满足一些特定条件: 首先,开发者必须加入苹果开发者计划连续两年以上。并且在过去一年里,其 App 在欧盟地区需要拥有至少超过一百万次首次安装量。 除此之外,苹果还要求开发者通过苹果的公证流程,并发布透明的数据收集政策。▲ 设置中关于网页下载 App 的隐私选项,图片来源:ZOLLOTECH 当用户第一次网站下载 App 时,系统会有多个弹窗,详细解释这个 App 的功能和所需的权限。之后再次下载时,则不会继续弹窗。 上周 ,Epic 的首席执行官 Tim Sweeney 在 X 上转发了一条推文,称安装网页分发的 iOS App 需要 15 个步骤。这条推文在网络上传播非常广泛。 但在今天的 iOS 更新中,可以发现事实并非如此。首次通过网页安装 App 需要八步,之后再次安装仅需三个步骤。整个安装体验还是相对简单的。虽然不通过 App Store 分发,能为开发者省下巨额的「苹果税」抽成,但苹果依然准备继续向开发者收费。 苹果新的业务条款中规定,开发者的 App 在过去的 12 个月中,在所有渠道(包括 App Store、网页分发和侧载商店)的安装次数只要超过 100 万次,就需要支付 0.5 欧元(约 3.8 元人民币)的核心技术费。 但是对于非营利组织、经认可的教育机构和政府单位,苹果则不会收取这项费用。遗憾的是,和 iOS 17.4 上加入的第三方应用市场一样,网页侧载仅限于iPhone,并且只能在欧盟使用。 虽然侧载功能暂时与我们无缘,但 iOS 17.5 还是有很多小更新与我们有关。 例如,播客 App 的得到了一系列优化。现在小组件可以根据播客封面,来动态改变小组件颜色。▲ 播客 App 小组件背景变化,右图为 iOS 17.5 的效果。图片来源:Gearrice 苹果在 iOS 17.4 上,为播客带来了「转写文字」功能,但是最初并不支持国行 iPhone。 现在,升级至 iOS 17.5 后,国行 iPhone 也可以支持「转写文字」功能了。我们将可以直观的通过文字预览播客,还能对内容进行搜索。 不过,目前「转写文字」对中文的支持还在持续优化中。之前在 iPadOS 17.5 的测试版中,9to5Mac 还发现了多段代码,暗指新款 Apple Pencil 将有一项重要的更新:全新的「挤压手势」(squeeze)。 新的挤压手势允许用户快速进行一些简单交互,可以使用户在各种操作中更加方便灵活地添加形状、签名、贴纸或文本等内容。 据推测,该手势将通过按下 Apple Pencil 笔杆表面来触发。关于 iOS 17.5 的正式更新,还尚未有具体时间。 从目前的消息来看,iOS 17.5 大概率将会和新款 iPad 一起在五月发布。最后,如果你想要体验 iOS 17.5 Beta 2 版本,只需下载 Apple Developer,并登陆你的 Apple ID,之后就能在系统更新界面看到 iOS Beta 版本的下载入口了。 iPhone XR 和 Xs 系列,以及在这之后推出的 iPhone 机型都支持更新。 不过,这毕竟还只是 iOS 17.5 的第二个测试版本,其中许多功能还不稳定。除了尝鲜体验外,并不建议普通用户日常使用。此外,在升级前请务必备份好重要数据。 --- 本帖转自红板报
软正改进Chrome浏览器在Windows 11和10上的字体渲染效果 作为开源的支持者,微软一直在积极推动 Chromium 的开发。微软已经改善了 Chrome 浏览器在触摸 PC 上的体验,提高了滚动速度,现在正寻求升级 Google 浏览器在 Windows 上的字体渲染,使其与本地应用程序的清晰度相匹配。2021 年,微软对 Edge 进行了更新,以支持改进的字体渲染和 Windows ClearType Tuner。这些变化让 Edge 的清晰度与原生 Windows 应用程序不相上下,现在微软正在为包括 Chrome 浏览器在内的所有 Chromium 浏览器带来类似的改进。 微软最近在 Chrome Status 上发布了一份文档,确认它正在将 Windows ClearType 文本调谐器集成到 Chrome 浏览器中。该功能名为"Windows ClearType 文本调谐器集成",旨在确保在 Windows 设备上尊重原生文本渲染偏好。 得益于微软的支持,Chrome 浏览器 124 版的字体渲染效果将得到改善 长期以来,一些具有特定显示配置的用户在使用 Chrome 浏览器时发现,网站上的字体看起来模糊不清或太细,难以阅读。而Firefox和微软 Edge 等其他浏览器则没有这个问题,而且看起来更美观。 在Chromium 的一个旧主题中,一位用户提到,在Google Chrome 浏览器中长时间观看模糊的文本甚至会让他们感到头痛。 出现这种情况是因为 Chrome 浏览器不遵循 Windows 本机字体渲染。默认情况下,Windows 本地应用程序会使用DirectWrite(本地文本堆栈 API)获取各种对比度和伽玛值用于文本渲染。Chromium 也使用 DirectWrite,但 Google 的实现仅限于识别字体等特定任务。 Google依赖 Skia 图形库,它是跨平台字体渲染的不错选择,并能完成工作。这意味着Google可以在所有平台上处理自己的文本形状和渲染。不过,与其他应用程序相比,这种方法会导致文本在 Windows 上的显示效果出现明显差异。 一段时间以来,微软一直在努力解决这些问题。2021 年,微软发布了 Edge 更新,允许浏览器支持 Windows ClearType 字体渲染。虽然 Chrome 浏览器无法"完全支持"ClearType,因为它使用 Skia 进行文本渲染,但微软已经进行了一些更改,将 ClearType Tuner 的值应用到 Google Chrome 浏览器的文本渲染中,通过 Chrome 浏览器的 Skia 文本渲染后台,ClearType Tuner 的值已尽可能接近 ClearType。 微软的一位代表说:"由于 Chrome 浏览器使用 Skia 进行文本渲染,因此无法完全支持 ClearType。不过,最新的 Canary 将在 Windows 上应用 ClearType Tuner 的值,并将其映射到 Skia 文本渲染,这是目前最接近 ClearType 的支持。" 现在,Windows 11/10 版 Chrome Canary 已默认启用了这些改进,并可能随 124 版一起向公众发布。
跨越生死的数字魔法:AI“复活”影响有多大 AI“复活”的质量取决于数据量,当前所能实现的“数字人”仅是浅层的、表象的数字映像,尽管在模拟外观和声音方面取得成功,但在复制个体情感和思维模式上仍面临绝大挑战,跟拥有逻辑智慧的真人相差甚远。从这个意义上讲,“数字永生”是个伪命题 AI“复活”本质是与现实生活互斥的竞争关系,所谓的“数字永生”会与现实世界争夺有限的资源,也可能弱化我们的情感 AI“复活”等短暂的给予只是暂时迷惑了心灵,总有一天我们依然要面临取舍,而那些关于逝者动态更新的数据,也会以某种逻辑进行勾连,进而产生新的认知困扰和遗忘难题 仅需一张照片和一段录音,就能让逝者在数字世界“永生”。一段时间以来,曾存在于科幻电影和小说中的情节——用AI“复活”逝者在一些人口中似乎正成为现实。 台湾地区音乐人包小柏借助AI技术“复活”亡女,商汤科技已故创始人汤晓鸥的数字人“现身”公司年会,以及网友接连“复活”李玟、张国荣、高以翔、乔任梁等离世明星……一时间AI“复活”技术引来关注无数。 随着乔任梁父亲表示对此“不能接受,感到不舒适”,李玟母亲及家人认为给其“带来巨大的心理冲击和二次伤害”,对AI“复活”技术是否会被滥用、是否会侵害数据隐私等个人权益等的讨论成为舆论焦点。 人们注意到,在各大电商和社交平台,AI“复活”技术已成一门新生意。它们往往包装以温情的外衣,利用明星引流吸引目标客户,由专业代理利用专门话术与客户沟通,再由专门技术人员制作视频,产业链初步形成,收费从一百到数万元不等。 尤其让人警惕的是,迅猛发展的生成式AI技术在很多方面超越了固有观念,渐渐呈现出一种社会生活或将被全面重置的态势。在这样的语境下,AI“复活”技术为满足人们的精神与情感需求提供了新载体,却也引发争议:用AI技术能否让逝者实现“数字永生”?“复活”背后潜藏哪些风险?虚实世界的规则和秩序将会如何碰撞?其对行业发展和社会进步究竟意味着什么?特别是在新技术层出不穷的当下,我们应怎样面对新技术遭遇的伦理考问?观众在安徽省合肥市举行的第五届世界声博会上了解“个性化3D虚拟人构建”产品 AI“复活”术边界何在 多位受访专家提出,AI“复活”是深度合成技术的一个应用场景。AI“复活”技术目前并不成熟,呈现效果参差不齐,短时间内大量公司“入局”,在规则不明的情况下存在诸多法律风险和安全隐患。 《互联网信息服务深度合成管理规定》要求,深度合成服务提供者和技术支持者提供人脸、人声等生物识别信息编辑功能的,应当提示深度合成服务使用者依法告知被编辑的个人,并取得其单独同意。 民法典规定,死者的姓名、肖像、名誉、荣誉、隐私、遗体等受到侵害的,其配偶、子女、父母有权依法请求行为人承担民事责任。 这意味着,如果被编辑人是逝者,理应取得近亲属同意,这是现行法规中不可逾越的红线和底线。 “尽管逝去的明星属于公众人物,但未经其近亲属同意便进行‘复活’无疑是侵权行为,其近亲属可依法追究行为人的法律责任。”中国互联网协会法工委副秘书长胡钢说。 对于一些普通人“复活”亲人的行为,浙江省公共政策研究院研究员高艳东表示,应从私域和公域两方面讨论。在私人领域“复活”自己的近亲属,并不存在法律问题。而在公共网络空间,“复活”他人需经逝者近亲属同意,如果死者生前对自己的个人信息做出约定或安排,则不能利用其个人信息“重生”一个数字人。 在高艳东看来,法律应采用“不管私用、严管公用”的思路,不干涉私人领域的AI“复活”,只需限制其用途,比如利用隐形水印等技术对“生成内容”进行“标识”,以防止“复活”视频用于诈骗等不法用途。而一旦进入公共网络空间,法律则应从源头预防和治理其可能带来的隐私泄露、涉诈犯罪等风险,技术开发者和平台也都应承担相应责任。 而在具体的操作层面,由于AI需要处理大量个人敏感数据,如面部表情、语音语调等,对于逝者生前的个人信息、聊天记录等“数字遗产”能否继承、如何继承等,目前尚无明确法律规定。对谁有权使用、如何避免不当获取、使用应遵循何种规范等,仍需进一步明确。 “不能放任AI‘复活’变成一门没有规矩和底线的‘生意’,尤其要保护对新技术可能普遍不敏感的中老年用户群体。”中国法学会消费者权益保护法研究会副秘书长陈音江表示。 另据了解,尽管我国已出台关于人工智能技术治理的相应法律法规,由于互联网技术快速衍生的特性,对于AI“复活”等新的技术应用,在责任界定、隐私保护、流通盈利等方面仍存空白。随着技术不断迭代升级,治理的最大难点在于技术发展的快速性和风险的不确定性,未来还需进一步规范完善。 胡钢建议,针对新兴技术的立法规范应遵循“快立频修”原则,尽快划定技术发展的红线和底线,始终要求技术的发展不能突破国家安全、社会公共利益和公序良俗的底线,并根据技术发展阶段频繁修订,让监管跟上技术发展的步伐。 “数字永生”能实现吗 业内人士介绍,AI“复活”技术依可能实现的技术水平被规划数字孪生、数字原生和“数字永生”三个阶段。 数字孪生阶段的技术重点在于对人物外观实现精确复制,AI通过分析处理个人照片、视频等视觉资料,生成数字化形象;数字原生阶段侧重对人物声音的特征提取、模型训练和生成,此时数字人开始具备声音等部分“内在”特征;而“数字永生”阶段则力图实现外观、声音像人,且行为和思维也能高度模拟人,达到类似“永生”状态。 中国社会科学院哲学所科技哲学研究室主任段伟文表示,AI“复活”的质量取决于数据量,当前所能实现的“数字人”仅是浅层的、表象的数字映像,尽管在模拟外观和声音方面取得成功,但在复制个体情感和思维模式上仍面临绝大挑战,跟拥有逻辑智慧的真人相差甚远。 在中国人民大学哲学院教授刘永谋看来,“数字永生”是个伪命题。他认为人类的大脑活动是宇宙间最大的谜团,“复制大脑”在技术层面无法实现。当前所谓的“数字克隆人”其原理只是通过分析人们在互联网以及各种数字设备上被记录的行为痕迹,生成能在一定程度上模仿目标主体“数字人格”的数字模型,实际无法与真正的本我对应。 刘永谋提醒,要警惕建立在“AI泛灵论”语境下的AI夸大宣传。他解释说,当前有人有意夸大AI技术的可能性,是在利用人们对未知事物的恐惧达到炒作目的,使其在新一轮科技革命的各项关键技术角逐中获取更多资源,必须褪去AI技术的魔幻外衣使其回归本来面目,真正为人类服务。 在段伟文看来,当前AI发展已进入全数据驱动阶段,通过对目标主体的各类数据进行精确分析可以在一定程度上透视其行为方式、性格特征、价值取向等人格特质,甚至可以分析其在不同时空下的人格流动,但这种分析是建立在统计学意义上的平均计算,只能大体划定目标主体的相对特征,并不能模拟其在复杂情境中的自由意志,更不具备人的能动性。 同时也要看到,AI技术正在重塑我们的生活空间和思维方式,它创造了一种对现实世界进行调适的新方式,并且不能简单以真假评判,更应关注其所带来的多重可能,推动我们重新定义和理解生命的本质。 特别是在当前技术迅猛发展的背景下,我们的数据管理水平仍处初级阶段,需要尽快提升数据治理能力和治理水平,加快建设具有国际竞争力的数据治理体系。 北京师范大学哲学学院教授田海平认为,目前的技术方案主要是通过来自人类的反馈训练并迭代人工智能系统,尚不能实现复杂情境下人对规则的动态把握和自我颠覆,未来让人工智能系统参与到“与人类的共同行动”中来是大势所趋,这种“相与模型”的创建必然要求预先设立具体化的“机器人宪章”,在人工智能系统与人类之间确立一种具有约束力的关系,以便AI技术能够与人类社会的法则对齐,避免AI产品从人类追责体系中逃逸。 从更宏大的语境观察,随着人工智能技术的跨越式发展,人与“类人”之间的问题正在出现,倒逼我们追问人类自身,审视和反思人类现有的规则体系,以更长远的视角寻求人机合作的多种可能。 高艳东建议兼顾AI“复活”技术的发展与安全,一是设立严格的准入门槛,完善事前审批制,严控使用用途,二是建立一套针对数字人的保存、销毁机制,以免数字人成为失控的“数字幽灵”。 技术如何与思念“对齐” AI“复活”技术的发展应用使个体的身份认同变得更加复杂——当逝去的亲人以数字化的形式“复活”,是否意味着他们真的“回来”了?这种“复活”有助于缅怀逝者,还是有损于对逝者的尊重和记忆?诸多问题正在挑战我们对“人”的传统理解。 上海交通大学马克思主义学院数字化未来与价值研究中心教授闫宏秀表示,数字技术使人们的记忆和思念也在被技术化,在数字空间里,人类记忆在一定程度上被推进到超越时空的永久化状态,随之而来的是超大容量的数据存储难题。 刘永谋表示,在数字时代想要记住一个人并非难事,并且这种记忆注定与财富、权力等社会资源密切相关进而呈现阶层化的特性。“换句话说,谁有能力购买更大的存储空间,谁就有可能拥有更逼真的数字记忆甚至在某种程度上接近‘永生’,随之而来的伦理追问使人们不得不关注‘复活’的目的和可能的影响。” 在刘永谋看来,这种“复活”本质是与现实生活互斥的竞争关系,所谓的“数字永生”会与现实世界争夺有限的资源,也可能弱化我们的情感。“遗忘本身也是人生的一道风景,过分沉溺于虚幻的数字世界不利于我们在现实世界中寻求可能的安慰,体验人生的丰满。”刘永谋说。 在复旦大学科技伦理与人类未来研究院教授杨庆峰看来,AI“复活”技术让死者重新被记起,这是一种想象投射和回忆构建,它能让人们再次唤醒沉睡的记忆,同时也会形成新的记忆从而替代原有记忆,这一过程可能造成新的伤害。 闫宏秀认为,需要追问的是,即便是出于善意的情感需求,生者是否有权复活逝去的亲人?被“复活”的数字人触动了传统的生命观念,当时空成为一种数字化的魔幻现实,思念还有意义吗?“这些短暂的给予只是暂时迷惑了心灵,总有一天我们依然要面临取舍,而那些关于逝者动态更新的数据,也会以某种逻辑进行勾连,进而产生新的认知困扰和遗忘难题。” “95后”受访者小程表示,他无法从情感上接受用AI“复活”亲人的尝试。“技术工具的冰冷无法创造出情感的温度。AI‘复活’虽然提供了新的缅怀方式,但幻境再美终是梦,珍惜眼前始为真。有时睹物思人只需一张照片、一条语音甚至是一片树叶就好,被刻意营造的似是而非的真实,带来的痛苦往往多于美丽。”小程说。 遗忘和割舍从来不是易事。高艳东表示,我们应该看到AI“复活”技术对情感疗愈的积极意义,也要看到其可能带来的消极影响。如果过度依赖技术,可能削弱个体应对挑战的韧性,带来社会情感空间的异化。 段伟文说,我们正处于一个体验型社会,个体的情绪价值被无限放大并有了实现的可能。任何新技术都要经历“魔法—技术—信仰—审美”四个周期,眼下的AI已经从魔法进入技术的实操,必然会冲击固有的虚实和生死边界。他建议监管部门应在具有高风险的技术应用领域建立伦理复核机制,确保数据隐私安全,防范可能的伦理风险。 他特别提到,在地缘政治风险上升的大背景下,AI技术将会在不同国家和地区呈现完全不同的发展轨迹,随着人和机器呈现更深度的纠缠互动,我们要把AI技术作为与未来世界对接的重要支点,在越来越多的应用领域探索人机协作的新模式。 一个容易被忽略的悖论是:遗忘恰恰是思念的必要条件,如果没有遗忘,也谈不上思念。有些人终其一生都在与过去告别,却忘了如果不抓住每一个现在,这些转瞬即逝的当下也会成为过去。 人类从诞生之初就在寻求永生,永生的欲望就像追求自由和爱情的本能一样,既令人沉醉,也必然带来伤痛,所有美好的事物都有这样的两面性。如果有机会能够让那些最珍贵的记忆成为体外化的存在甚至是智能体本身,会不会改变原有的社会关系?换言之,我所怀念的,还是那个“他”吗? 从这个意义上说,思考是必须的,结论是开放的。当记忆世界以外化的形式向我们敞开,我们终将在认知的持续更新中寻找内心的自洽。 --- 图:由新华社 提供 本帖转自新华社
谷歌豪掷千亿美元加速AI研发,DeepMind领航未来科技 谷歌旗下AI研究部门DeepMind的首席执行官Demis Hassabis近日透露,谷歌计划投入逾1000亿美元用于人工智能技术的研发,这一巨额投资凸显了硅谷在AI领域的激烈竞争。Hassabis还自豪地指出,谷歌的计算实力已经超越了微软等其他行业巨头。当前,人工智能已成为全球科技竞争的焦点。谷歌此次的大手笔投入无疑将为AI技术的发展注入新的活力。与此同时,OpenAI推出的ChatGPT所引发的广泛关注表明,尽管现有人工智能系统还存在诸多不足,但公众对其的接受度已经显著提升。 DeepMind作为谷歌的重要研究部门,一直致力于推动AI技术的进步。此次谷歌的巨额投资不仅将加速DeepMind的研发进程,也有望为整个AI行业带来更多的创新和突破。 在计算能力方面,Hassabis强调谷歌已经超越了微软等竞争对手。这无疑为谷歌在AI领域的研究和开发提供了强有力的技术支持。随着人工智能技术的不断发展,我们有理由相信,谷歌将在这一领域继续领跑,并带来更多令人瞩目的成果。
AMD推出新款AI PC芯片,加入与Nvidia和Intel的人工智能大战 据外媒消息,在人工智能技术日益融入个人电脑的当下,AMD周二宣布推出新款处理器,旨在为支持AI的个人电脑提供更强动力。此举标志着AMD在与竞争对手Nvidia和Intel的人工智能个人电脑市场竞争中迈出重要一步。 新发布的处理器包括针对笔记本电脑的Ryzen Pro 8040系列和针对台式机的Ryzen Pro 8000系列,均采用了先进的4纳米工艺技术。AMD宣称,这是迄今为止商用PC领域性能最强劲的芯片,专为执行实时语言翻译、摘要等AI任务而设计。 据AMD在新闻稿中透露,这些新款处理器预计将从2024年第二季度开始为惠普、联想等知名品牌的PC机型提供支持。新款AMD芯片的问世,无疑将为Nvidia和Intel专为AI PC设计的芯片带来强有力的竞争。 值得一提的是,与Nvidia相似,AMD也不直接生产芯片,而是将制造过程外包给半导体代工厂。目前,AMD的主要合作伙伴是全球最大的代工芯片制造商台积电。 今年一月,AMD已经发布了基于4纳米工艺的下一代Ryzen 8000G系列台式处理器,以强大的动力和卓越性能满足游戏和内容创建等高负荷工作需求。 随着ChatGPT等人工智能应用在2022年11月的推出并蓬勃发展,AMD和Intel均将人工智能PC视为行业的新发展方向。AMD总裁Victor Peng在今年2月向CNBC表示,预计AI PC市场将持续扩大,并在2024年下半年迎来大幅增长。 与此同时,各大芯片制造商都在积极开发更高效、更强大的AI应用芯片。Nvidia于今年一月初推出了新款GPU,以支持PC上的生成式AI应用程序,而Intel也在去年12月发布了可在PC上运行AI功能的Core Ultra芯片。 市场研究机构Gartner预测,到2024年,人工智能PC的出货量将占到所有PC的22%,预计今年年底人工智能PC的出货量将达到5450万台。然而,随着技术的普及,供应商可能面临如何在竞争中脱颖而出并提升收入的挑战。
苹果推出iOS 17.5开发者预览版,网页直接下载App功能亮相 4月17日消息,苹果公司在今日凌晨向开发者们推送了iOS 17.5的开发者预览版Beta 2系统更新。这次更新中,苹果引入了一项引人注目的新功能:用户现在可以直接从网页上下载安装iOS应用程序。这一变革性的举措为开发者打开了一扇新的门户,使他们能够直接在自己的网站上提供应用的下载链接。不过,这项便捷的新功能目前仅适用于iPhone用户,并且其使用范围限制在欧盟区域内。虽然此功能大大简化了应用获取的流程,但苹果对提供网页下载的开发者设定了严格的门槛。只有那些连续两年或更长时间参与Apple Developer Program,并且在过去一年里,其iOS应用首次安装量超过100万次的开发者,才有资格在其网站上提供应用的直接下载。 尽管这一新功能使得开发者能够绕过App Store进行应用分发,从而节省了原本需要支付给苹果的“苹果税”,但苹果并未完全放弃收费。根据苹果的新规定,如果开发者在过去12个月内,应用安装量超过100万次,那么他们需要支付0.5欧元(约合3.8元人民币)的核心技术费。当然,这一费用并不适用于非营利组织、经认可的教育机构和政府实体。
被禁售的NVIDIA GPU卡惊现中国!从未见过的96GB内存 A100是最早被禁售给中国的NVIDIA GPU加速卡,近日国内某“海鲜市场”上出现了一块特殊的A100开发样品,规格和正式版截然不同。作为工程样品,它的设计就很不一样,布满了非标准的电压测量点,以及大量的跳线,还有两个8针供电接口(以及一个空焊位)。 它采用了A100 20BF核心,理论上是升级版A100B,但从未出现。神奇的是,它可以刷入A100 SXM版本的固件,能正常使用,只是功耗不正常,会一直跑在最高的750W。 规格方面,CUDA核心数为7936个,比零售版的6912个多了15%,但依然不是满血,还是屏蔽了256个。 HBM2E高带宽内存容量达到了96GB,比零售版的40/80GB多了不少,位宽也解锁了完整的6144-bit。 作为样品,核心和内存频率反而更高,核心基准就有1260MHz,加速被隐藏,而内存达到了1404MHz。
Altman:AI成本或可降至接近零 近日OpenAI 首席执行官 Sam Altman和公司首席运营官 Brad Lightcap 共同参与访谈节目,并在节目中透露:AI成本或可降至接近零。 Altman 表示,AI的计算成本将持续下降,AI 的价值将随着模型质量提升而不断上升。OpenAI 可以将非常高质量的 AI 技术成本降至接近零,这将对世界上大多数事情非常有利。 Brad Lightcap也表示希望将 ChatGPT 技术投入到业务流程中,从而实现可量化的投资回报率。他认为企业供应链非常需要AI 技术的加持,将 ChatGPT 投入到供应链管理特定流程可将特定领域支出削减 20%。不过企业采用周期较慢,而 ChatGPT 企业版仍在缓慢落地中。
【04-15 | 日常交流】影响力权益登记表过期 chatgpt吧贴吧影响力,根据规则五,为了替吧友们申请更多权益,吧主尝试点击其中的“权益登记表” 但点击后显示问卷已过期。 问卷链接如下, http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fiwenjuan.baidu.com%2F%3Fcode%3Dnlec1g%26_client_version%3D12.57.5.0&urlrefer=9dc305a5693fd52378e1513cbc11c445 请吧务帮忙提供最新的链接,感谢。
纽约律协发布人工智能报告 人工智能工作组发布了一份近 80 页的报告和关于人工智能 (AI) 和生成式人工智能对法律职业的法律、社会和道德影响的建议。该报告还审查了基于人工智能的软件、生成式人工智能技术和其他机器学习工具,这些工具虽然可以增强专业水平,但也会带来风险。它还为 NYSBA 应用人工智能提出建议,包括提出负责任的人工智能 使用指南。报告包括四项主要建议: 采用指南:工作组建议NYSBA采用本报告中概述的人工智能/生成式人工智能指南,并委托一个常设部门或委员会来监督这些指南的定期更新。 关注教育:工作组建议NYSBA将教育置于立法之上,重点是教育法官、律师、法学院学生和监管机构了解这项技术,以便他们能够应用现有法律来规范它。 识别新法规的风险:立法机构应确定与现有法律未涉及的技术相关的风险,这可能涉及涉及人工智能专家的广泛听证会和研究。 研究法律在人工智能治理中的作用:人工智能的快速发展促使我们审视法律作为治理工具的功能。在人工智能背景下,法律的一些关键功能是: (1)表达社会价值观和加强基本原则; (2)防范此类价值观和原则的风险; (3)稳定社会和增加法律确定性。 报告主要包括8类风险: 不断扩大的司法差距:指出虽然人工智能可能是司法民主化的解决方案,但它可能会创造一个“两级法律体系”,将服务不足的社区或经济能力有限的个人降级,依赖劣质人工智能驱动的技术。 在获得人工智能可能给他人带来的好处方面存在障碍,包括:(1)无法访问计算机/互联网;(2)在如何使用人工智能方面的设施/素养有限;(3)对政府机构的高度不信任。 数据隐私和监视:基于人工智能系统聚合大量个人数据的能力,对人工智能破坏公民自由和数据隐私的可能性的担忧,这可能导致隐私侵犯,包括:(1)政府和公司使用人工智能进行全面监控和社会控制;(2)黑客使用人工智能工具合成个人数据,通过深度伪造冒充个人并进行网络盗窃。报告还指出了对培训数据缺乏透明度、模型中固有的偏见以及知识产权所有权的担忧。 安全:除了网络威胁外,人工智能使用带来的一般安全问题,当人工智能被用于高风险应用时,例如与生物识别数据和基础设施系统结合使用时,这种担忧会被放大。在上述一般社会问题的基础上,《报告》指出了几个安全问题,包括当扮演关键角色的人工智能系统出现故障并造成伤害时,我们如何应对人工智能操纵情绪的潜力,可能导致心理伤害,过度依赖人工智能可能导致人类技能和能力的丧失,以及人工智能的行为不可预测, 这可能会导致有害或意想不到的后果。 社会和伦理问题:注意到人工智能算法已被用于延续和放大社会偏见,包括:(1)性别和种族偏见;(2)与人工智能相关的不良心理问题(例如,人工智能聊天机器人自杀)的增加;(3)人工智能系统做出决策时的责任分配;(4)意识形态偏见,尤其是与社交媒体结合使用时;(5)通过生成虚假内容作为未来的训练数据来创建一个“回音室”,导致基于意识形态的“幻觉”和不准确。 错误信息:通过将“深度伪造”与生物识别数据(例如,声纹和面部映射)相结合,使“深度伪造”更加可信经济影响和破坏:注意到人工智能的经济影响是多层次的,包括任务自动化的工作岗位流离失所的直接影响,以及传统上由人类提供的服务(如法律服务)贬值的间接影响。 法律和监管挑战:报告评论了当人工智能造成损害或伤害时,法律如何努力分配责任,法院如何努力解决涉及知识产权的问题,包括版权(例如,训练数据保护)、产出所有权和发明专利,现行法律法规未能跟上人工智能的发展步伐,以及像大多数科技公司一样,跨境执法将继续存在困难提供全球人工智能系统。 失去以人为本和控制:它提到了人工智能自主发展的担忧,人工智能系统在人类理解和控制之外的运行中造成生存威胁,人工智能可能在没有人类监督或道德考虑的情况下做出关键决策的风险,人工智能决策可能不重视人类生命或人类产生的输出,导致我们受到人工智能的威胁,人工智能在没有人类同理心或理解的情况下做出道德决定。
OpenAI 承诺不会使用 API 收集的客户数据训练模型 OpenAI 今日举办系列推介会,并在会上表示,OpenAI 不会使用 API 收集的客户数据来训练大语言模型。这些活动面向金融、医疗保健和能源等各行各业的高层决策者。OpenAI 首席执行官 Altamn、首席运营官 Brad Lightcap 等多位高管出席,并在推介会上介绍了OpenAI 的多款新产品。 Altman 也在推介会上表示,通过 ChatGPT Enterprise 获得的客户数据,不会被用于训练模型的未来迭代版本。
2025年将带来搭载M4 Ultra的Mac Studio/Pro,或选择跳过M3 Ultra 去年10月30日,苹果在主题为“Scary Fast”的2023年第二场秋季新品发布会上,一口气发布了M3、M3 Pro和M3 Max,采用了3nm工艺制造。不过时至今日,M3 Ultra仍然没有到来。随着近期越来越多有关M4系列的信息流出,让人怀疑M3 Ultra是否还会出现。据Wccftech报道,近期一份报告指出,苹果计划在新款Mac工作站产品上搭载M4 Ultra芯片,至少其中一款机型会在2025年年中推出。由于剩下也就大概一年多一点的时间,传闻苹果在M4系列芯片上会对人工智能(AI)工作负载进行重点优化,使得更多的人猜测苹果可能会选择跳过M3 Ultra,而将重点放在下一代芯片上。 M4 Ultra的代号为Hidra,将用于新款Mac Studio和Mac Pro。新款Mac Studio更有可能先于新款Mac Pro发布,同时会提供搭载M4 Max的版本,而新款Mac Pro大概要等到2025年下半年。 至于M3 Ultra还存在较多的疑问,有业界分析师表示苹果会在2024年底发布这款芯片,这意味着与传闻中M4的发布时间非常相近。也有市场研究机构指出,M3 Ultra会在今年年中到来。至于苹果是否会打破Ultra芯片的发布规律,选择直接跳到M4 Ultra,还有待观察。
苹果iOS 18将推全新AI功能,完全运行于设备端 据彭博社记者马克・古尔曼(Mark Gurman)最新爆料,苹果即将在iOS 18中推出的新一代AI功能将实现完全本地化运行,摆脱对云服务器的依赖。 在今日的Power On通讯问答中,古尔曼明确指出:“备受全球瞩目的苹果AI技术,预计将在6月10日由苹果发布,其首批功能可以在设备上直接运行。这意味着,支持这些新功能的大型语言模型将不再需要云端处理。”尽管苹果目前的首要焦点是设备端AI功能,但未来仍有可能推出基于云端的AI服务。这些可能的云端AI功能或许会借助谷歌的Gemini或其他供应商的技术。有报道显示,苹果已与谷歌、OpenAI以及中国的百度等就潜在的生成式AI合作进行了初步探讨。虽然iOS 18可能不会包含苹果自家的ChatGPT式聊天机器人,但Gemini或其他类似技术是否会被直接整合进iOS 18还有待观察。 此外,从苹果供应链传出的消息来看,公司正在积极采购AI服务器,这可能预示着苹果未来会推出自家的云端生成式AI功能。一些苹果供应链分析师,如郭明錤和Jeff Pu,也对此表示了确认。 传闻iOS 18将为iPhone的多个内置应用,包括Spotlight搜索、Siri、Safari浏览器、快捷指令、Apple Music、信息、健康,以及Numbers、Pages、Keynote等带来全新的生成式AI体验。据古尔曼之前的报道,生成式AI技术有望提升Siri处理复杂问题的能力,同时,信息应用也可能会获得自动完成句子输入的功能。 苹果年度开发者大会WWDC将于6月10日至14日举办,届时苹果将正式发布iOS 18及其一系列软件更新,我们拭目以待。
Google遭遇劲敌!OpenAI新品又抢风头? Google与OpenAI之间的AI竞赛日趋激烈。Google CEO桑达尔·皮查伊曾宣布,Alphabet将成为一家AI优先的公司,而Google在深度学习、自然语言处理等领域的持续投入也显示出其对AI技术的重视。然而,随着ChatGPT的崛起,Google不得不从和平时期转向战时准备状态。尽管Google在AI领域有着深厚的积累,但OpenAI的异军突起给其带来了巨大的挑战。在近期的Google Cloud Next活动中,Google宣布了其最强大的模型Gemini 1.5 Pro的开放,该模型能处理长达11个小时的音频和1小时的视频。然而,就在人们还在热衷于体验Gemini 1.5 Pro时,OpenAI宣布推出了GPT-4 Turbo的正式版本,该版本不仅基础能力有所更新,还增加了读图功能,并已向所有ChatGPT付费用户开放。 这一消息让本该是Google的一大亮点Gemini 1.5 Pro黯然失色。事实上,这已经不是OpenAI第一次在关键时刻对Google进行“狙击”。此前,OpenAI就曾多次在Google发布重要产品时推出自己的新品,从而抢占了市场的风头。 OpenAI的这种策略无疑给Google带来了巨大的压力。尽管Google在AI领域有着丰富的技术底蕴,但OpenAI凭借其敏锐的市场洞察力和强大的产品发布能力,始终保持着对Google的领先地位。这也让人们开始质疑,Google是否能够在这场AI竞赛中迎头赶上。 然而,无论是Google还是OpenAI,他们都明白,这场AI竞赛才刚刚开始,未来的路还很长。而谁能够在这场竞赛中脱颖而出,还需要时间和市场的检验。
Intel 11代酷睿终于允许升级Windows 11 如果你还在使用Intel Rocket Lake 11代酷睿处理器和Windows 10系统,想要升级到Windows 11,好消息终于来了:微软已经修复2021年就已发现的Bug,解除了升级限制。这个Bug存在于Intel SST智能音频驱动之中,受影响版本号10.29.0.5152、10.30.0.5152(两个不同分支),会导致部分11代酷睿升级Windows 11系统的时候蓝屏崩溃。 当时,Intel很快就升级了新驱动,只要版本号不低于10.29.0.5714、10.30.0.5714(注意后四位数字即可),就不存在此问题,理论上可以正常升级Windows 11。 但不知道为什么,微软一直没有放开限制,11代酷睿长期无缘升级Windows 11。 最近,微软终于将Intel的新驱动放上了Windows Update,11代酷睿用户只要更新升级,或者通过Intel官网直接安装新驱动,耐心等大概最多48个小时,就可以看到Windows 11的升级选项了。 至于为什么拖了将近三年,微软并没有解释。
有关共享账号的一些提醒 与他人共享账号是一种常见的行为,但需要注意以下几点提醒:包括期可能违反OpenAI用户使用规范规。 合法性问题:在共享账号之前,请确保这种行为在相关服务的使用协议中是被允许的。因为OpenAI服务用户使用协议中明确禁止共享账号,如果违反了这一规定,账号可能会被封禁,而无法正常访问服务。 隐私保护:账号共享可能会涉及个人隐私信息,确保你信任共享对象,并只与亲朋好友共享。不要随意共享账号信息,并尽量减少提问任何包含隐私信息的问题。 安全性:共享账号时,因为密码是公开给共享者的,无法避免账号被共享对象再次分享给任何更多其他陌生人,造成滥用而导致封号的情况。 账号管理:如果多人共享一个账号,最好有一种方式来协调账号的管理,包括付款、密码更改、账号信息更新等。 ^_^ 账号共享但要谨慎行事,我们不应该只图便宜,就忽视其他方面的问题,应确保合法性和安全性,同时尊重服务提供商的使用政策。请在过程中注意个人信息隐私安全,以及各自的权益保护,避免不必要的损失。
【转发】【搬运】Mia大佬的攻略 转发Mia的赛季攻略 Mia辛苦。 欢迎大家关注QQ频道和QQ群获取更多资讯。 祝大家开心快乐每一天#高塔挑战# #石中剑#
王国的一角 rt 加州激流勇进
AI 在逐渐改造世界 自从 ChatGPT 发布之后,整个 AI 的发展进程就开始加速,AI 也开始逐渐对各个行业发生深刻的影响。本文总结了 AI 对职业发展、企业发展、投资和个人发展的影响,希望能帮到大家。在没有新增量的时代,存量成本重构是为数不多的机会,也是推动 AI 发展的主要动力。 一、AI 对职业发展的影响 AI 在取代人工: 移动互联网时代,抢增量是大家的主要目的,懂得业务流程,可以把业务流程还原成设计原型,同时能组织团队开发实现的产品经理会很吃香,也获得了与之匹配的高薪资。互联网发展至今,存量博弈,公司的主要目的是降本,AI 工程师和 AI 产品经理岗位需求端快速增加,了解业务,抽离共性的特征,交给 ai 学习来最后达到取代人工或者只需要简单的人工介入。 服务于 AI 取代人工工作的人会得到好的职业回报: 企业经营重心的变化,会导致成本投入出现变化,也决定了互联网产品经理的收入会不如 AI 产品经理,同时负责基础研发的工程师薪资也会出现明显的下滑。市场在招一些工程性开发工程师,给出的薪资明显不如前两年,这会成为降本时代的常态。简单讲,一些服务于 AI 取代人工的工作,短期内会得到不错的收入,一些重复性劳动的职业,会低收入化或者逐渐被 AI 取代。 二、AI 对企业发展的影响 对创业来讲: 没有信息差和生产过剩,会带来去溢价,也意味着创业的容错率很低,容错率低和低溢价,企业如果想生存下来,就必须要具备大规模或者对成本结构重构,本身是需要大资金或者高智力密度投入,这也意味着创业难度指数级增加。 对已经实现业务场景盈利的企业来讲: 更希望借助 AI 来实现端到端,需求端到生产端的高效化,高速化以及低成本交付化,一些电商企业在招聘时,AI 工程师占的比重不低。世界上所有的商业都可以理解成把商品(想法)从 a 地搬运到 b 地,溢价是确定的情况下,搬运成本越低越好,省出来的就是企业的利润。 三、AI 对投资的影响 投资有 2 个逻辑,一个是投资先进生产力,一个是投资保值增值产品。 AI 代表着先进生产力,实现 Aigent,需要算,存,训一体化,像人一样获取信息,存储信息,分析信息做出决策,根据结果纠正行为。通常由这三部分要素组成:计算,存储,训练。构建 AI 基础设施的计算领域和存储领域都有一些顶级的公司。一些有大业务场景的公司也在使用 AI 训练,提效,抖音 CEO 转任剪映也可以看出来字节跳动在 AI 端发力,如果剪映被分拆上市的话,我想我会第一时间买这家公司的股票。 任何不可再生且越来越少的都是保值增值好的投资标地,当科技领域变化越来越快,世界迈入不确定时,我们看到巴菲特在增持能源股,黄金在涨价。 四、对个人发展的建议 学习 AI,了解并使用 AI 软件,提升自身产出能力。守住手中的不可再生资产,减少无意义的消费。
ChatGPT怎么提问才有效果?5个超实用的ChatGPT 提示词技巧! ChatGPT 是一款风靡全球的生成式人工智能(AI)工具。虽然它有时可能会胡编乱造,但在编写提示时,有很多技巧可以确保获得理想的结果。这就是我这篇文章的目的。 在本文中,我会介绍如何编写提示词,让 ChatGPT 中的 LLM(大语言模型)提供理想答案。 事实上,编写有效的提示词已经成为一门新兴的学科,被称为 "提示工程(Prompt Engineering)"。 专注于提示词的开发和优化,目的是帮助人们在各种场景和研究领域中更好地利用大语言模型(Large Language Model, LLM)。掌握相关的提示工程技能可以更全面地了解大语言模型的能力和局限性。如何编写有效的 ChatGPT 提示词 1. 像与朋友交谈一样与AI对话 使用ChatGPT就像是在跟朋友聊天,也许我们应该放下很多平时工作时的习惯,因为ChatGPT跟以往的程序不太一样,你得以一种更自然的方式跟它交流。 就好像你在跟一个同事或朋友交谈一样。如果这样你觉得别扭,那就给它起个名字,比如叫它"Bob"。 这样一来,跟它聊天就会变得更自然,你可能会加入一些聊天的细节,分享一些小故事来让你的谈话更加丰富有趣,还能探索更多的可能性。 在与人交流时,经常会遇到对方一开始不太懂你在说什么,需要你解释清楚。有时候,对方可能会跑题,你得把话题拉回来。 在聊天中补充一些背景信息,或者问一些复杂的问题,然后根据对方的回答再提新问题,这都是很常见的事。 这就像是在进行一场互动式的对话。别怕问一连串的问题。你问一个问题,得到回答后,再基于这个答案问下一个问题。 这就像和朋友聊天一样。你不可能只问朋友一个问题就结束对话,而是会继续交流。和人工智能聊天也是同样的道理。 所有这些都是在你应该与ChatGPT交流的方式。 2. 提供问题的详细背景信息 编写 ChatGPT 提示不仅仅是提出问题。还需要提供相关的背景信息,让它更好地理解你的问题是在什么情况下提出的。 比如说,你想准备马拉松比赛。你可以问 ChatGPT: 我该如何准备马拉松比赛? 但是,如果你告诉AI你正在为第一次马拉松比赛做准备,那么你会得到更详尽的回答。你得到的答案会更加关注于你的需求,例如: 我是一名跑步初学者,以前从未跑过马拉松,但我想在六个月内完成一次马拉松。我该如何为马拉松比赛做准备? 你是否知道如何向人工智能提供了更多的信息,从而为你提供了更有针对性和更有帮助的答案? 下面再举两个提供上下文问题的例子: 我打算在几个月后去西班牙旅游,因此,我希望掌握一些基础的西班牙语,以便能够更好地与当地人沟通。我在寻找一些适合完全初学者的西班牙语在线学习资源。我特别期望这些资源能够提供系统和全面的语言教学内容,包括发音、日常用语、基本语法等。请问你能推荐符合这些条件的在线西班牙语学习资源吗? 在这样的情况下,与其说是询问学习资源,不如说是通过上下文将人工智能的回答重点放在学习如何与当地居民进行实地交流上。下面是另一个例子: 我目前负责一家初创公司的新媒体运营工作,该公司专注于可持续生活方式和环保产品。随着社交媒体平台的竞争日益激烈,我发现要吸引和维护目标受众的注意力越来越难。我正在寻找创新的内容创作和互动策略,以增加我们品牌的在线可见度和用户参与度。此外,我也希望利用数据分析来优化我们的营销策略,更好地理解我们的受众和提升转化率。请问有哪些具体的工具或方法能帮助我们在这些方面实现目标? 在这个示例中,重点不是仅仅询问创新的内容和互动策略,而是特别关注利用数据分析来优化营销策略,以及如何实现目标。 我再举一个更详细的提示词例子。 注意:我将答案限制在 500 字以内,因为 ChatGPT 似乎会在 500 到 700 字之间中断,导致故事说到一半就中断了,而且当你让它接着写时,它很难接上前面的内容。希望未来的版本能提供更长的答案。 下面是我要说的示例: 请你写一个短篇故事,不超过 500 字。 在 2339 年的成都。隐藏在一条古老巷子里,有一家拥有浓厚川文化特色的书店,这家书店的存在仿佛与周围的现代建筑格格不入。书店里有以下人物: 店主:让这位店主变得有趣,有点与众不同,给他起个名字,至少拥有一项技能或特征,这将影响他的背景故事,甚至可能影响整个短篇故事。 店员:店里有一名店员叫李青。 顾客和他的朋友:李伟和小芳是一起进店的两位顾客。李伟穿着传统的中式衣服,显得既庄重又不失时尚感,而小芳则显然是刚从设计公司工作一天后直接来到书店。 另一位顾客是王莉莉,她是店里的常客,40 多岁。还有一位顾客是陈晓明,他的年龄在 40 - 60 岁之间。他身上散发着一种神秘的气息,看起来既高傲又神秘。陈晓明身上有些东西让其他人感到不舒服。 零售业的一个典型概念是,"后面 "总是有更多的存货,那里有一个储藏室,可以存放顾客浏览的货架上可能没有的其他商品。这个故事的前提是,这家书店的 "后面 "有些不同寻常。 将这一切组合在一起,讲述一个引人入胜的有趣故事。 你可以问ChatGPT:帮我写一个关于书店的故事,看看它会回复什么。然后输入上面的提示,你就会看到不同之处。通过尝试不同的提示,你会发现ChatGPT会有不一样的表现。3. 要求ChatGPT进行角色扮演 ChatGPT可以模仿不同的人或职业的视角来写作。比如,你可以让它模仿教师、营销主管、记者等角色来进行写作。 比如,让ChatGPT从三个不同的角度来描述Xiaomi 蓝牙音箱——分别是产品经理、户外健身爱好者和新闻记者。以下是这三个提示: 从产品经理的角度,描述Xiaomi 蓝牙音箱。 从户外健身爱好者的角度,描述Xiaomi 蓝牙音箱。 从新闻记者的角度,描述Xiaomi 蓝牙音箱。 你可以把这三个不同的提示输入给ChatGPT,看看它会怎么回答。不过,只要简单几句话,你就能明白ChatGPT怎么样能根据不同的角色给出不同的答案。你可以看到,当ChatGPT扮演不同的角色时,它会从不同的视角来回答问题。 4. 别让 ChatGPT 偏离目标或主题 ChatGPT有时候会跑题,说些没根据的事或者根本就是乱编。 但你可以用一些方法让它回到正轨,还能让它保持真实性。 我最喜欢的一件事就是让ChatGPT来解释它的答案怎么来的。我会问它“你为什么这样认为?”或者“你有什么证据证明你的说法吗?”大多数时候,如果它回答错了,它就会道歉,然后给出一个新的答案。 有时候,它还能给出一些关于其推理路径有用信息。无论如何,但记住,可以让ChatGPT告诉你它信息的来源。 如果你跟ChatGPT进行了长时间的对话,你会发现它会开始跑偏,不过这种情况不只是AI会出现,跟人聊天聊多了也容易跑题。 所以,跟ChatGPT聊天时,你可以用跟朋友聊天时相同的方法来引导对话。就是轻柔地把话题拉回来,提醒它咱们原来聊的是什么,以及你想了解些什么。 5. 不要害怕去尝试 提升提示词编写技能的一个好方法就是去尝试AI聊天机器人能做些什么。 试着给ChatGPT各种有意思的提示,看看它怎么回应。然后调整一下这些提示,看看会有什么不同的结果。这里有五个示例供你参考: 想象你是雷雨中从天而降的雨滴。描述你从云里形成,一直到落到地上的过程。你看到了什么?感受到了什么?经历了什么? 假设你是一个被遗忘在阁楼上几十年的玩具。说说你的感觉、回忆起与孩子们玩耍的快乐时光,以及重新被人发现的那份期待。 写下一个决定在特定年代定居的时间旅行者的最后一篇日记,解释一下他们为什么选那个年代,以及他们从旅行中学到了什么。 假设两个不可能会交谈的物品(比如茶杯和手表)正在对话,谈谈它们的日常生活和面对的挑战。 试着从一只蚂蚁的视角描述蚁群中的一天。深挖蚂蚁的政治、面临的挑战和它们的社会结构。 在测试这些提示的时候,不要只是关注ChatGPT给出了什么答案,也要注意它是怎么得出这个答案的,它在哪些地方做得不够好,以及它似乎在哪些方面有局限。 所有这些细节都能帮助你更好地理解和利用这个工具,让你的提示变得更有效和多样化。 更多提示词写作技巧 随时重新提问。ChatGPT 经常会在每次提问时改变答案。 对你的提示做一些调整,引导它给你一个更好的答案。 只要当前页面是打开的,ChatGPT 就能记得你们之前的对话。如果你离开该页面,它就会忘记之前的交流。需要注意的是,ChatGPT 有时也会 "因为某种原因 "而失去记忆,所以你可能得时不时重新引导一下对话。 打开一个新页面意味着会开始一段全新的对话。 超过 500 字的回答有时会中断。请务必说明你想要的回答长度。 你可以根据AI之前的回答来纠正和明确你的问题。如果它误解了你的意思,你可以告诉它哪里理解错了,然后继续对话。 如果它不想回答你的问题,可以重新描述问题。使用 "角色 "来引导它可能不想回答的问题。 如果你想引用资料来源,告诉它要支持或证明它的答案。 ChatGPT 免费用户现在可以使用自定义指令。你可以给 ChatGPT 提供一组随时可用的提示,这样你就不必重新输入了。 考虑订阅 ChatGPT Plus。这样你就可以使用自己的数据进行强大的分析。你还可以从网上获取数据。 尝试向 Gemini 或Copilot 提出同样的问题。它们可以给你提供不同的观点或答案。 要求举例说明。如果你想了解 ChatGPT 对你的要求理解程度,可以问它 "你能给我三个例子说明是如何工作的吗?"或类似的问题。 要求它重复你最初请求的部分内容。例如,如果你让它分析一篇文章,告诉它 "为了确保你能理解,请回述前三个标题 "或 "我想确保你能理解我的意思,请总结一下这篇文章中讨论的主要矛盾"。测试它是否跑偏。 有时,ChatGPT 就是会失败。继续尝试,但在必要时学会放弃,转而使用其他工具。它还不够完美......。
在线解答问题 有关openai chatgpt相关,如果吧友们有任何问题随时给我留言,我会第一时间回复。
官方在X平台上宣布已推出GPT-4 Turbo模型 根据X平台上OpenAI的12日的最新发布: 我们持续投资于改善我们的模型,并期待看到您的使用成果。如果您还没有尝试过,GPT-4 Turbo 现已在 ChatGPT Plus、Team、Enterprise 和 API 中提供。 例如,在使用 ChatGPT 时,回应将更直接、更简洁,并使用更多的对话语言。我们的新版 GPT-4 Turbo 现已向付费 ChatGPT 用户提供。我们在写作、数学、逻辑推理和编程方面的能力得到了提升。
百度不开源文心一言,为何还自信能领先? 4月12日消息,近日,百度公司创始人李彦宏在内部讲话中阐述了百度决定不对其人工智能模型文心一言进行开源的原因。在目前国内推出开源模型的公司并不多的情况下,百度的这一决策引起了业界的广泛关注。李彦宏解释了百度选择不开源模型的几个主要原因。他提到在去年文心一言发布时,百度就预见到市场上将会有多家公司开源其模型。在这种情况下,他认为多百度一家开源并不多,少百度一家也不少。其次,从经济角度出发,对外开源需要维护一套开源版本,这在李彦宏看来并不划算。更重要的是,他坚信闭源模型在能力上会保持持续领先,而非一时之优。 据了解,李彦宏还指出,模型开源的实际意义可能并不如预期。他认为,当前的开源模型大多是进行小规模的验证应用,缺乏大规模算力的检验。这与传统的软件开源,如Linux和Android,存在显著差异。他举例说,尽管meta的Llama项目鼓励大家贡献数据和代码,但实际上主要的开发者仍然是meta的团队,Llama并非一个真正由社区协作开发的产品。李彦宏进一步强调,闭源模型具有真正的商业模式并能创造收益,从而能够聚集更多的算力和人才。此外,在成本方面,闭源模型也具有明显优势。在相同能力下,闭源模型的推理成本更低、响应更快;在相同参数情况下,闭源模型的能力也更强。他还指出,无论在中国还是美国,最强的基础模型都是闭源的,而各种小模型都是通过大模型蒸馏而来,这使得闭源模型在成本和效率上具有优势。 在讲话中,李彦宏似乎暗示百度已经将文心一言视为国内最强的模型,与美国的GPT相提并论。同时,他也对文心一言能够在短时间内快速训练出来的原因保持神秘。这一表态无疑增加了外界对百度人工智能技术的关注和期待。
visionOS 1.1.2升级出现大规模问题,用户无法完成更新 日前,苹果正式发布了visionOS 1.1.2,这是对 visionOS 操作系统的微小更新。该更新引入了未指明的错误修复,并建议所有用户升级。然而,该升级推送到用户端时,出现了大规模升级问题。在海外贴吧 reddit 上,不少 Apple Vision Pro 用户反馈升级 visionOS 1.1.2 失败,下载完升级包后,一直处于“准备更新状态”。visionOS 1.1.2 在下载完升级包后,会处于“准备更新状态”,即使用户二次关机重启,再次下载升级包,依旧会卡在“升级已请求”界面,无法正常更新。 对于那些还处于 visionOS 1.0,从未升级过系统的用户而言,现在处于一个比较尴尬的状态,因为许多应用需要 visionOS 1.1 以上才能获得安装支持,然而目前苹果在软件更新界面,只提供 visionOS 1.1.2 的下载升级。
苹果称ReALM模型比GPT-4更强:能让Siri变得聪明 苹果依靠iPhone可以说赚得盆满钵满,iPhone也是一款综合性能十分出色的产品,不过在AI时代,苹果似乎落后其他厂商不少,特别是大语言模型更是苹果的弱项,在其他厂商都如火如荼推广自家的AI模型的时候,苹果似乎还在内部评估,距离正式商用还有很长的路要走。不过苹果却表示自家的ReALM模型的性能表现得不错,已经超过了现在大红大紫的OpenAI打造的GPT-4。目前苹果研究人员发表了一篇论文,在该论文中,苹果表示自研的ReALM模型在特定领域可以获得比GPT-4更加出色的成绩。ReALM模型更加偏向于实用性,称可以理解用户在屏幕上的实际操作与内容。苹果表示与GPT-3.5相比,在输入文字的情况下,ReALM模型的识别准确率比原来提升了5%。而在小型语言模型中,ReALM模型与GPT-4的表现相差无几,模型越大,ReALM模型的领先幅度就越大。换句话说就是ReALM模型所使用的语言模型参数更小,因此所需要的处理器性能也宽松,对于提升手机续航等有着一定的帮助。当然现在更多的大语言模型需要厂商进行专门的优化和适配,尤其是一些专用大语言模型,在特定场景下其性能能够提升数倍,而在其他通用场合的表现就不尽如人意,显然苹果的ReALM模型与iPhone、iPad等产品是高度契合的,因此可以将其效率到达最大化,也比GPT-4这样的通用语言模型更加出色。大家也希望苹果能够在WWDC 2024上公布更多关于大语言模型的消息,进而让目前的Siri更加智能。 只不过有消息称苹果内部对于大语言模型还十分地保守,暂时没有让其植入到Siri之中,或者采用第三方的语言模型以避免不必要的麻烦,看起来ReALM模型更像是一个期货,估计在iOS 18未来的版本中陆续推送。
微软或将Office家庭和学生版更名为Microsoft Office Home 2024 按照以往版本的发布时间来看微软预计会在今年秋季推出 Microsoft Office 新的永久买断版,即区别于 Microsoft 365 的订阅版,永久买断版在购买许可证后可以一直使用不需要续费、也可以在离线环境中使用。 原本永久买断版的主要产品主要是 Office 专业版 (专业增强版)、Office 家庭和学生版以及 Office 标准版等,不过今年微软看起来要对产品名称进行调整。 如果你已经通过 Office Tool Plus 安装部署 Microsoft Office 2024 家庭版和学生版的话,可能会在设置、关于、激活里注意到版本名称变成了 Microsoft Office Home 2024。 这个名称之前应该是 Microsoft Office Home and Student 2024,不知道现在微软将家庭学生版中的学生删除是出于哪方面考虑,版本功能方面倒是没有任何变化。 当然现阶段这些版本只是还在测试中,也有可能是微软改什么东西临时测试回头就会改回去,微软应该不至于再单独发布一个 Microsoft Office Student 2024 版。
OpenAI以泄密为由解雇两名研究人员 包括首席科学家盟友 据可靠消息透露,人工智能初创公司OpenAI最近解雇了两名涉嫌泄密的研究人员,此事在业界引起了广泛关注。据悉,这两名研究人员分别是利奥波德·阿申布伦纳(Leopold Aschenbrenner)和帕维尔·伊兹梅洛夫(Pavel Izmailov)。阿申布伦纳曾是致力于确保人工智能社会安全的核心团队成员,也是OpenAI首席科学家伊利亚·苏茨凯弗(Ilya Sutskever)的盟友。去年秋天,苏茨凯弗曾参与推动首席执行官萨姆·奥特曼(Sam Altman)下台的行动,尽管最终未成功。而伊兹梅洛夫则是一名专注于推理研究的专家,也曾在安全团队中工作。 目前尚不清楚这两名员工具体泄露了什么信息。但此次解雇标志着自奥特曼今年3月重返董事会以来,OpenAI人员变动的消息首次公开出现。此前,OpenAI的非营利性董事会曾就奥特曼去年11月被短暂解雇的风波进行了深入调查,并确认他没有不当行为。 OpenAI近期通过出售员工股票实现了高达860亿美元的估值,并正在与谷歌、Anthropic等业界巨头激烈竞争,开发支持ChatGPT等前沿产品的下一代基础模型。 值得一提的是,阿申布伦纳是OpenAI内部所谓超级对齐(Superalignment)团队的成员,该团队由苏茨凯弗于去年夏天组建,旨在开发控制和操纵先进人工智能(即所谓的超级智能)的技术,探索如何利用这种智能解决核聚变、星际殖民等人类面临的重大挑战。 在阿申布伦纳和伊兹梅洛夫被解雇之前,OpenAI的员工就如何安全地开发人工智能存在明显的分歧。阿申布伦纳与有效利他主义运动有紧密联系,该运动强调优先解决人工智能可能带来的潜在风险,而不仅仅是追求短期利益或生产力的提升。 苏茨凯弗作为OpenAI最大技术突破的功臣之一,曾在解雇奥特曼的原董事会中任职,并批评奥特曼沟通不够坦诚。然而,奥特曼重新掌舵后,苏茨凯弗退出了董事会,并在公开场合鲜少露面。 阿申布伦纳是一位才华横溢的研究者,19岁便从哥伦比亚大学毕业。他曾在未来基金(Future Fund)工作,这是由著名加密货币交易所创始人山姆·班克曼-弗里德(Sam Bankman-Fried)创立的慈善基金,专注于资助能“改善人类长期前景”的创新项目。阿申布伦纳一年前加入了OpenAI。 对于此次解雇事件及相关的置评请求,阿申布伦纳、伊兹梅洛夫以及苏茨凯弗的代理律师亚历克斯·温加滕(Alex Weingarten)均未作出回应。 另外,值得注意的是,解雇奥特曼的一些原董事会成员与有效利他主义运动有着千丝万缕的联系。例如,塔莎·麦考利(Tasha McCauley)是Effective Ventures董事会的成员,而Effective Ventures正是有效利他主义中心的母公司。海伦·托纳(Helen Toner)曾在专注于有效利他主义的开放慈善项目中担任重要职务。在奥特曼去年底重新担任首席执行官后,这两位也都离开了OpenAI的董事会。
AI新势力Kimi挑战百度霸权,阿里成背后金主 近期,一款名为Kimi的智能助手在国内AI领域掀起了热潮。其背后的创业公司月之暗面凭借Kimi的“200万字长文本”能力率先出圈,甚至催生了“Kimi概念股”。然而,随着阿里、百度等大厂的跟进,这场长文本推理能力的竞争日趋激烈。Kimi的走红,无疑给百度带来了巨大的压力。因为站在Kimi背后的,是阿里巴巴的身影。据ITBEAR科技资讯了解,月之暗面在最新一轮融资中获得了阿里的大力支持,阿里成为其持股40%的单一大股东。这一举动无疑加剧了百度与阿里在AI领域的竞争。 然而,尽管Kimi在短期内凭借长文本推理能力赢得了大量用户,但长期来看,这仅仅是通往通用人工智能(AGI)的一个必要技能。在实现AGI的过程中,还需要考虑多模态学习、神经网络架构创新、应用落地与生态建设等多个维度。因此,百度等大厂也在积极布局,力图在AI领域取得更全面的领先。 目前,百度已经在文心一言等方面取得了显著进展,并积极推动商业化落地。与此同时,阿里也通过投资月之暗面等创业公司,不断加强自身在AI领域的实力。这场AI领域的竞争,才刚刚开始。 尽管Kimi在短期内取得了显著的成功,但在资金、算力和商业化落地方面仍面临诸多挑战。未来,这场AI领域的竞争将更加激烈,各大厂商将如何布局和应对,值得我们持续关注。
微软升级网页版 Visio,符合条件用户可使用思维导图模板 微软发布新闻稿,面向拥有 Visio Plan 1 或 Visio Plan 2 许可证用户 ,在网页版 Visio 中引入思维导图(Mind Map)模板。微软表示会在未来几周时间里,通知符合条件的计划用户,邀请其体验和使用网页版 Visio 中的思维导图。 使用步骤如下: 1. 跳转到 Visio 模板页面。 2. 在左侧导航窗格中选择新的思维导图类别。 3. 将鼠标悬停在新的思维导图卡片上,然后选择“创建空白思维导图”。 4. 在空白页中,你可以开始使用新的思维导图模板中的形状。 5. 用户可以使用各种样式,包括填充颜色、不同的形状等等 6. 完成思维导图之后,用户也可以通过缩放、拉动等方式,轻松修改思维导图的结构。 7. 用户还可以通过简单地将节点套入另一个父节点来重新分配节点的 "父节点",或者删除节点及其 "子节点"。 为了让客户更容易上手,微软新增了八个可定制的思维导图示例:开展会议、Customer Persona、家庭树、财务规划、市场营销、项目规划、项目跟踪和故事大纲。 注:Microsoft Visio 是 Windows 操作系统下运行的流程图软件,该产品首次于 1992 年推出,由 Shapeware 公司开发,后于 2000 年被微软收购。它现在是 Microsoft Office 软件的一部分。
OpenAI全球大动作:AI芯片供应联盟将诞生? 据内部消息人士披露,全球人工智能领军企业OpenAI的CEO山姆·奥特曼(Sam Altman)正积极推进一个宏大的计划,意在构建一个集结了全球各国政府和业界巨头的联盟。这个联盟的核心目标是确保人工智能技术发展所必需的芯片、能源以及数据中心容量能得到稳定供应。 本周,奥特曼在阿联酋与多方投资者及政府官员进行了秘密会面。这些会议深入研讨了如何结合私营部门和各国政府的力量,共同投资建设那些对人工智能技术至关重要且投资巨大的基础设施。此外,他还计划本周晚些时候在华盛顿继续相关的商讨。据ITBEAR科技资讯了解,这些会面的背后,反映了奥特曼对全球芯片及其他关键基础设施供应短缺问题的深刻认识,以及他为解决这些问题所付出的努力。除了芯片供应,他还关注到了能源供应和数据中心容量的问题,这些都是人工智能技术发展不可或缺的支撑。 为了应对人工智能对芯片的巨大需求,奥特曼正在全球范围内筹集数十亿美元的资金,计划构建一个庞大的半导体工厂网络。同时,他与全球各地的政府官员的接触内容,也已经超越了单纯的芯片生产,延伸到了能源和数据中心的供应问题。 OpenAI的一位发言人表示,他们正在就如何增加全球基础设施,特别是芯片、能源和数据中心的供应链进行广泛对话,并期待在不久的将来能分享更多的进展。 奥特曼深知,为人工智能系统提供动力需要巨大的能源,这已成为科技行业面临的一大挑战。因此,他也在积极探索新的能源解决方案,如太阳能或核聚变,以支持这种高能耗的技术。 在本周的阿联酋之行中,奥特曼还与美国驻阿联酋大使进行了会面,并计划前往华盛顿与国会山及美国国家安全和情报部门的成员进行深入交流。这一系列会议都聚焦于美国及其盟友如何在全球人工智能领域保持领先地位,并确保稳定的人工智能基础设施供应。 OpenAI在寻求外国投资时,可能会面临美国外国投资委员会的审查,尤其是来自阿联酋等实体的投资。尽管如此,奥特曼仍积极寻求与全球各方的合作,以推动人工智能技术的持续发展。
微软 OneNote 将引入新功能,帮用户更快、更全面地掌控会议内容 微软近日发布新闻稿,邀请 Microsoft 365 Insider 项目成员,测试新版 OneNote 应用程序,重点改善和扩展了会议信息内容,帮助用户更快、更全面地掌控会议内容。 微软在新版 OneNote 中引入了“Meeting Details”(会议细节)选项,用户可以在统一窗口视图下,查看当前所有的会议内容。 除了有关会议的日期、描述和与会者等基本信息外,“Meeting Details”还包含来自 Teams 智能会议回顾的内容。这包括人工智能生成的会议记录、人工智能建议的任务以及在团队会议期间共享或生成的文档。
曝谷歌AI最高主管想离职,人才冲突不断,对超过OpenAI感到无望 据外媒The Information报道,谷歌DeepMind CEO的杰米斯·哈萨比斯(Demis Hassabis)曝出已对谷歌推动AI商业化的新举措感到失望,并认为谷歌的产品可能很难赶上OpenAI的Sora。一年前,谷歌仓促地将DeepMind和谷歌大脑两个实验室合并成谷歌DeepMind,由哈萨比斯领导。然而两个实验室合并后冲突不断,哈萨比斯在与其他领导者的合作上面临着重重困难。 消息人士称,哈萨比斯几个月前将两部门的合作限制了在Gemini项目上,这或许因为无意义的组织沟通让他沮丧;与此同时,精英员工频繁被挖走也是让哈萨比斯头疼的事情。 据曝料,哈萨比斯在谷歌AI部门与DeepMind合并前曾考虑离开谷歌,转而成立一个数十亿美元的新研究实验室。如果一系列问题得不到解决,这位谷歌AI总舵手会不会真的离开谷歌创业?引起产业的关注。 - 谷歌大脑与Deepmind合并一年:组织动荡冲突不断 谷歌仍未完全消除过去阻碍其AI工作的不和谐因素。哈萨比斯的DeepMind部门长期以来一直与公司内部的另一个AI实验室谷歌大脑存在冲突。一年前,谷歌匆忙将这两个实验室合并为一个,但它们之间的矛盾却未消减。 长期以来,谷歌一直运营着两个世界上最重要的机器学习团队。Google Brain是构建语言模型方面的先驱,它还发明了Transformer技术,OpenAI的ChatGPT就是在这项技术基础上完成的。与此同时,DeepMind构建了能够在象棋和围棋等游戏中取得优势的AI。但这两个团队经常在共享代码和计算资源等方面发生冲突。虽然OpenAI的ChatGPT借鉴了谷歌的Transformer技术,但他们都没有发布像ChatGPT那样能够引起互联网轰动的产品。 因此,OpenAI聊天机器人发布后几周内,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)指示谷歌大脑和DeepMind的高管们合作开发一个AI模型Gemini,他希望两个团队能够“同仇敌忾”而不是各自为战。 但合作并没有让两个AI团队突然变得和平,即使合并后,新的AI团队有时仍会因资源问题发生冲突。谷歌将AGI(人工通用智能)的探索性研究工作中的员工分流到Gemini的研发团队中。据内部人员透露,谷歌为了Gemini项目完全关闭了一些AI工作,Gemini项目员工目前已增加了约1000人。 巨大的内部调整使不断变化科研方向的员工们渐渐滋生了幻灭感。 - 哈萨比斯的两难:困于无意义组织沟通,为人才流失头疼 据The Information报道,哈萨比斯对于谷歌新的AI方向和计划感到不适,他认为自己很难适应新的现实。 DeepMind曾经在谷歌内部以独立方式运作,使每一位员工可以一心一意地从事AI的技术研究,而不必担心AI成果的商业化问题。但是现在,哈萨比斯面临着技术商业化的压力,他必须抽出时间与其他领导者更紧密地合作,将DeepMind的技术转化为产品。据最近几个月与哈萨比斯交谈过的两位人士称,这种态势让他深感沮丧。 谷歌对于技术商业化的第一步对准了合并谷歌的两个AI部门,但哈萨比斯似乎也对此举并不兴奋。 哈萨比斯在大会后告诉一位同事,他不确定自己是否愿意领导合并后的部门,或者说,他想考虑离开谷歌并成立一个约数十亿美元的新研究实验室。他认为这会带来一个全新的开始,从而摆脱“无意义”且浪费时间的组织沟通。但是DeepMind发言人卡尔却在一次声明中否认这两个消息。 据参加某内部会议的三位人士称,哈萨比斯在会议上的表现还是让人留下了他对合并AI部门淡漠的印象。据其中一人说,就在几个月前,哈萨比斯还努力的将两个部门的合作限制在Gemini项目上。 与此同时,精英员工频繁被挖走是另一个让哈萨比斯头疼的事情。 一个事实是,OpenAI持续高薪邀请并聘用谷歌的AI成员,AI团队存在着项目负责人大量离职的情况。媒体们也抓住了这些离职事件大肆宣传。据一位最近与哈萨比斯交谈过的人士透露,他曾抱怨谷歌的薪酬制度并不能够留住AI研究人员。但好在谷歌重视了这个建议,此后提高了对DeepMind研究人员的薪酬,还动用了一个特殊的股票池。 接踵而来的各类问题让哈萨比斯压力巨大,但是纽约大学一位心理学教授马库斯判断称,如果有人有能力把新事物塑造成想要的样子,那很可能就是哈萨比斯。但谷歌也是一家大公司,因此压力是存在的。 - Gemini:最新多模态大模型陷入争议,AI团队骨干离散严重 3月初,哈萨比斯在经历了几周的挫折之后,试图带头振作团队的精神。据相关人员的人透露,哈萨比斯告诉他的员工,谷歌全体员工需要更好地沟通,以避免发生技术失误。 这是因为,谷歌当时发布了一款采用了哈萨比斯团队的技术聊天机器人Gemini,也是谷歌认为可以赶超OpenAI的ChatGPT的最佳机会。测评人员称,Gemini模型声称能实时响应语音提示,但实际上它是在延迟状态下运行的,其产出的视频演示具有误导性。此外,Gemini还因带有种族主义的回答以及夸大其词的功能介绍而招致嘲笑。这可能是因为,展示AI进展的压力导致哈萨比斯的团队夸大了产品的工作能力。 不过最近,哈萨比斯进行了一些组织变革,以恢复谷歌AI研究的影响力。今年3月,哈萨比斯调整了内部管理团队,让更多的研究主管可以直接与他联系。现在谷歌负责不同领域AI研究的高管都直接向他汇报工作。 哈萨比斯拥有击败OpenAI所需的一切要素,他麾下有许多世界顶尖的机器学习研究人员。而且,他还在监督一个团队将DeepMind的科学进步整合到新产品Gemini中。截至三月,有36人直接监督Gemini的开发(已有两名人员辞职)。▲36人直接监督开发Gemini(来源:The Information) 谷歌在思考新的AI产品。Gemini项目中现在有一个专门的团队在研究代理,即可以自动执行计算机任务的软件。据一位参与该项目的人士透露,团队接连失去许多资深研究员,但也同时增添了许多有实力的新面孔。 哈萨比斯坚持认为AGI(人工通用智能)离他们并不远,是超越OpenAI的一个方向。为了更好地衡量实现其长期目标的进展情况,DeepMind的研究人员正在开发专门针对AGI的新基准。工作人员还希望Gemini能帮助他们完成另一项任务:提出新的方法和算法,以改进他们的研究。 DeepMind因Gemini的发布缩小了与OpenAI在技术上的差距,但并没有消除这种差距。虽然Gemini的某些表现要好于OpenAI的GPT-4,但OpenAI的模型早在几个月前就已经问世。哈萨比斯认为谷歌要想赶超OpenAI的AI视频服务Sora尤其困难。(另外,谷歌上周表示,如果OpenAI使用谷歌旗下的视频网站来训练Sora,将违反YouTube的规定) - AI总舵手曝异心,谷歌DeepMind承压 谷歌AI团队合并后各种问题接踵而来,但合并前两个部门已拥有庞大的数据中心网络和数十亿产品用户,在AI产品的推广比同行容易得多。因此,谷歌还没有真正意义上的遇到了解决不了的困难。 哈萨比斯虽然对谷歌各类新举措和突发状况感到不满,但他仍未放弃探索超越竞争对手OpenAI。可惜的事实是,OpenAI的AI技术已研制出众多令业界惊叹的成果,谷歌却在一些基础问题上兜圈子。哈萨比斯是一个坚韧的人,平衡技术研究和公司规划知识一个时间问题。我们可以期待他带领的新谷歌AI团队为谷歌产品提供新动力,为AI未来提供新思考。
OpenAI与Meta重磅!新AI模型将颠覆你的认知? 近日,人工智能领域的两大巨头OpenAI和meta宣布,他们即将推出全新的人工智能模型,这些模型不仅将具备强大的推理和规划能力,更被认为是实现超人认知的关键步骤。这些新型模型的问世,无疑将为生成式人工智能应用注入强大的动力。 OpenAI和meta表示,他们研发的新型人工智能模型在认知能力上有着显著的突破,能够有效进行复杂的推理和规划任务。这对于需要高级思考和决策能力的应用场景,如自动驾驶、医疗诊断和金融投资等领域,具有重大意义。这些新模型采用了先进的深度学习技术,通过大规模的训练数据,使模型能够理解和模拟人类的思考过程,从而实现更为精准和高效的推理与规划。这一技术的突破,不仅提升了人工智能的决策能力,还使其更加接近人类的认知方式。 业内专家普遍认为,OpenAI和meta的这一创新是推动人工智能领域发展的关键一步,它将为生成式人工智能应用提供更为强大的支持。未来,这些模型有望在各个领域发挥重要作用,推动社会的智能化进程。
估值860亿美元!OpenAI邀请前员工出售股份 据媒体报道,知情人士透露,OpenAI已经通知部分前员工,允许他们出售公司股份。 此举是对公司最近860亿美元估值收购要约的进一步动作,这使得OpenAI跻身全球最具价值的初创公司之列。这笔交易将由Josh Kushner领导的风险投资公司Thrive Capital主导。 原定于去年进行的股票出售,因去年11月OpenAI董事会罢免首席执行官Sam Altman而推迟。随后,公司重新聘请了Altman,并正在调整董事会成员。 除了收购要约,OpenAI还在探讨新一轮融资,有望将公司估值推高至1000亿美元以上。与此同时,Altman正积极筹集资金,以增加全球尖端计算芯片的供应。 一年多前,OpenAI首次推出惊艳的人工智能聊天机器人ChatGPT,迅速在硅谷掀起人工智能热潮。自此,科技巨头、投资者和初创公司纷纷跟进,推动这一技术的快速发展。 OpenAI始终保持着行业领先地位,不仅从其他投资者处获得资金支持,还与微软达成了高达130亿美元的合作协议。
OpenAI推出视觉增强版GPT-4 Turbo模型,简化开发流程 OpenAI今日声明,已向开发者广泛开放了其全新的GPT-4 Turbo with Vision模型,这一模型在继承了GPT-4 Turbo系列的特点的同时,首次引入了视觉理解能力。这一视觉增强的GPT-4 Turbo模型,不仅维持了原系列128,000个token的窗口大小和截止到2023年12月的知识库,更融合了图像识别技术,从而赋予了模型新的视觉分析能力。在此之前,开发人员通常需要分别调用不同的模型以处理文本和图像数据,而现在,GPT-4 Turbo with Vision的出现打破了这一常规,它将文本和图像处理功能整合到一起,不仅简化了开发流程,而且为各类应用开辟了新的可能性。 不少开发者已经开始利用这一新模型进行创新实践。例如,名为Devin的AI软件工程助手正使用该模型提升其编程辅助能力;而健康健身应用Healthify则通过它来分析用户上传的饮食照片,提供个性化的营养建议;创意平台Make Real更是巧妙地运用GPT-4 Turbo with Vision,将手绘草图转化为实际可运行的网站代码。 尽管这一强大功能目前还没有被整合到ChatGPT中,也未向公众开放,但OpenAI已暗示这一视觉增强的聊天功能不久后将在ChatGPT上亮相。
英特尔的最强AI芯片要来了,声称性能完胜英伟达H100 美国东部时间4月9日凌晨,英特尔发布了其最新的人工智能芯片Gaudi3,预计将在第三季度大范围上市。在当天举办的Intel Vision 2024大会上,英特尔CEO帕特·基辛格( Pat Gelsinger) )手持新款Gaudi3亮相。与上一代Gaudi2芯片相比,最新的Gaudi3芯片在BF16(一种16位的浮点数表示方法,为业界衡量AI计算的基础指标)计算能力上提升将近4倍,同时内存带宽也增加了近1.5倍。 与竞争对手的正面对标也不落下风。英特尔声称Gaudi3已全面超越英伟达去年发布的H100芯片:运行人工智能模型的速度是H100的1.5倍,支持AI模型的推理能力平均提高了50%,能效平均提高40%。 这家老牌芯片巨头表示,Gaudi3已经与英伟达最新的H200大致相当,在某些领域甚至表现更好。 在实际应用上,这款专为AI加速计算设计的芯片可用来支持大模型的训练与推理,预计能够大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。同时它还能用于更大规模参数量的AI模型的推理,如70亿、700亿参数的Llama 7B、70B,以及1800亿参数的Falcon 180B。 英特尔Gaudi3采用了台积电5纳米的制程工艺打造,将于二季度首先面向戴尔、惠普、联想、超微电脑等设备制造商(OEM)出货,计划三季度大范围上市。 发布旨在与英伟达抗衡的芯片之时,英特尔还公布了一系列针对AI战略布局的产品与技术,具体包括: ·2024年将要推出的下一代酷睿Ultra PC处理器,代号Lunar Lake。该处理器主要为AI PC而设计,计划年内出货4000万台AI PC,覆盖轻薄PC和游戏掌机等设备; ·为企业数据中心服务器推出的全新至强6处理器,计划于今年第二季度推出; ·为零售与工业制造等领域设计的边缘计算产品、帮助企业低成本部署AI模型等软件产品的解决方案等。 基辛格在现场演讲中预测,到2030年,半导体市场规模将达1万亿美元,人工智能是主要推动力。 包括英特尔和AMD在内,都在全力追赶英伟达,使得“最强AI芯片”赛道的竞争变得愈发激烈。 AMD去年推出的MI300系列AI芯片预计将在今年加大出货,有消息称已经收获大量客户的订单。按照官方介绍,这也是一款超越英伟达H100的产品。 而在刚刚过去的GTC大会上,英伟达也通过最新发布的B200 GPU芯片刷新了自己的纪录,再次拉开了与竞争对手的差距。这款芯片上容纳的晶体管数量比H100多出两倍有余,运算速度更是其30倍,是当前英伟达旗下性能最强的AI芯片产品。 即便如此,英特尔仍未放弃挑战英伟达的霸主地位。虽然官方并未透露Gaudi3的价格,但英特尔负责Xeon软件的副总裁Das Kamhout告诉界面新闻等媒体,公司希望通过这款芯片在价格、技术与产品上的多项优势,成为英伟达有力的竞争对手。
谷歌宣布Gemini 1.5 Pro开放API 新增多项功能 Google宣布开放其AI模型Gemini1.5Pro的API,这一版本在原有基础上进行了大幅度的功能扩展,现已在180多个国家提供。 Gemini1.5Pro引入了对原生音频(语音)的理解能力,以及文件API和系统指令等新功能。这使得Gemini模型能够直接处理音频输入,而无需先将音频转换为文本。这为AI模型带来了全新的应用可能性,如音频和视频模态的处理。详情点此查看: http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fdevelopers.googleblog.com%2F2024%2F04%2Fgemini-15-pro-in-public-preview-with-new-features.html&urlrefer=483dc0f9c8086a2e9cf0dde82ca3d8d8 音频理解能力: http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Fgoogle-gemini%2Fcookbook%2Fblob%2Fmain%2Fquickstarts%2FAudio.ipynb&urlrefer=a360f2ed42738e56b10f16a9782bf0e3 Gemini1.5Pro大大扩展了输入模态的范围,现在它不仅能理解文本,还能理解音频(语音)。此外,Gemini1.5Pro还可以对上传到Google AI Studio中的视频进行图像(帧)和音频(语音)的同时推理,这意味着这个模型具备了理解和处理视频内容的能力,不仅限于视频的视觉部分(如图像帧),也包括音频部分(如对话、背景音乐等)。 这一改进的应用潜力巨大,包括多模态理解、内容索引和搜索、增强的交互体验、视频内容分析以及创意内容生成等方面。例如,通过综合分析视频中的视觉信息和音频信息,Gemini1.5Pro可以更全面地理解视频内容,从而帮助创建更详细的内容索引,使用户能够基于视频内容的视觉和听觉信息进行搜索。 此外,Gemini API也进行了一些重要的改进。比如,引入了系统指令引导模型响应,现已在Google AI Studio和Gemini API中提供。开发者可以通过定义角色、格式、目标和规则来指导模型的行为,以适应特定用例。同时,新的JSON模式指示模型仅输出JSON对象,该模式支持从文本或图像中提取结构化数据。 Google还推出了新的嵌入模型,性能得到了显著提升。从今天开始,开发者将能够通过Gemini API访问Gemini下一代文本嵌入模型。这个新模型在MTEB基准测试中取得了更强的检索性能,超过了具有可比维度的所有现有模型。
马斯克预测人工智能将在明年超越人类智能 埃隆・马斯克表示,只要供应电力和硬件能够满足日益强大的技术需求,新的人工智能模型的能力将在明年底超越人类智能。 他在与挪威国家银行投资管理首席执行官尼古拉・塔根进行的一次访谈中预测称:“我猜测,我们将会在明年底左右拥有比任何一个人类更聪明的人工智能。” 马斯克在 Tesla、X 和 SpaceX 等公司担任首席执行官。他预测,在未来五年内,人工智能的能力可能会超过所有人类。马斯克一直对所谓的人工通用智能发展持乐观态度,即 AI 工具如此强大,可以击败任何领域中最有能力的个体。但他在周一的一次访谈中提出的预测超前于他和其他人此前预测的时间表。去年,他预测到2029年将实现 “全面” 的人工通用智能。谷歌 DeepMind 的联合创始人德米斯・哈萨比斯 (Ee) 今年早些时候预测,到2030年可能会实现人工通用智能。 过去18个月的一些 AI 突破,包括视频生成工具的推出和更有能力的聊天机器人,已经比预期推动了 AI 的前沿。马斯克表示,发展的步伐受到微处理器供应瓶颈的影响,尤其是那些由 Nvidia 生产的微处理器,这些微处理器对于训练和运行 AI 模型至关重要。供应限制正在缓解,但新模型现在正在测试其他数据中心设备和电力网格。他表示:“去年是受到芯片限制…… 人们无法获得足够的 Nvidia 芯片。今年正在过渡到电压变压器供应。一两年后 [限制] 就是电力供应了。”
苹果开发出能看懂屏幕上下文的人工智能技术ReALM 苹果开发出了一项能够实时理解和识别用户屏幕上显示内容的人工智能技术,而且无需依赖屏幕截图或图像数据输入。这项技术被称为ReALM(Real-time Analysis of Live Media),它使得在与用户交流的过程中,智能助手能够看到用户所看到的一切内容,并理解用户当前正在进行的活动,从而随时提供帮助。论文地址:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Farxiv.org%2Fpdf%2F2403.20329.pdf&urlrefer=dba6b851fc6dbdda1ba9e321dd2363e7 ReALM技术通过将屏幕上的元素和布局转换为文本形式,然后利用这些文本信息来解析用户提出的与屏幕内容相关的查询或指令。比如用户可以说“打开我屏幕上显示的第一个应用”或“读取屏幕中央的新闻标题”,即使实际上该智能助手并未“看到”用户的屏幕。 这种能力特别适用于需要对屏幕上信息进行快速反应和处理的应用场景,比如虚拟助手和辅助技术等。通过ReALM技术,智能助手可以更加智能地理解用户的意图,并提供更加准确和个性化的帮助和服务。 这一举措预示着 iOS18将于2024年6月的 WWDC 发布,届时我们预计将推出全新的 Siri2.0,尽管目前尚不清楚该模型是否会及时集成到 Siri 中。这并不是苹果最近几个月在人工智能领域的首次尝试,公司推出了一系列新模型、工具以及合作伙伴关系,所有这些都预示着一家准备将人工智能作为业务中心的公司。 ReALM 是苹果快速增长的人工智能研究团队发布的最新消息,也是第一个专注于改进现有模型的消息,使其更快、更智能和更高效。 该公司声称,甚至在某些任务上优于 OpenAI 的 GPT-4。最新发布的详细信息来自苹果公司于周五发布的一篇新的开放研究论文,首次由 Venture Beat 在周一报道。对于它是否将实际成为 iOS18的一部分,苹果公司对此尚未置评。 ReALM 是如何工作的? ReALM 与 GPT-4等模型相比要小得多。但这是因为它不需要做所有的事情。它的目的是为其他人工智能模型提供上下文,比如 Siri。 这是一个视觉模型,重新构建屏幕并标记每个屏幕实体及其位置。这创建了屏幕布局的基于文本的表示,可以传递给语音助手,为用户请求提供上下文线索。 在准确性方面,苹果表示,尽管体积更小、速度更快,ReALM 在一些关键指标上的表现与 GPT-4相当好。 这对 Siri 意味着什么?这意味着,如果未来版本的 ReALM 被部署到 Siri—— 甚至是这个版本 —— 那么当用户告诉它打开这个应用程序,或者告诉我这个图像中这个词的含义时,Siri 将更好地理解用户的意图。 它还将使 Siri 在不必完全部署像 Gemini 这样的大型语言模型的情况下具有更多的对话能力。当结合其他最近的苹果研究论文,允许 “一次性” 响应 —— 即 AI 可以从单个提示中获得答案 —— 这表明苹果仍在大力投资于 AI 助手领域,而不仅仅依赖外部模型。
我们应该如何与人工智能交流? 2015年11月18日 本帖转自史蒂芬·沃尔弗拉姆,2015年的一篇短文,探讨了如何使用自然语言和计算机语言与AI交流, 欢迎吧友加入交流回复。 以下是正文: --------------------------- 不是很久以前,用普通英语问计算机广泛的问题,这个想法看起来像科幻小说。但当我们在2009年发布Wolfram|Alpha时,其中一个大惊喜(至少对我来说!)是我们设法让这变成了现实。到目前为止,人们每天都会用普通语言向个人助理系统(许多由Wolfram|Alpha提供支持)提出成千上万的问题。图:用普通语言提问,从Wolfram|Alpha得到答案 这对快速问题或简短命令(尽管我们一直在努力做得更好!)来说效果相当不错。但更复杂的事情呢?与人工智能更认真地交流的最佳方式是什么? 我思考了这个问题很长时间,试图从哲学、语言学、神经科学、计算机科学和其他领域整合线索。有点让我惊讶的是,我最近意识到的是,答案的很大一部分可能就摆在我面前,以我过去30年来一直在建设的Wolfram语言的形式出现。 这可能是拥有一把锤子,然后看到一切都像钉子的情况。但我相当确定还有更多。至少,思考这个问题是一种了解更多关于人工智能及其与人类关系的方式。 计算是强大的 我通过我在基础科学中做的一系列发现明白的第一个关键点是,计算是一种非常强大的东西,它让即使是微小的程序(如元胞自动机或神经网络)也能以极其复杂的方式行为。这就是人工智能可以利用的那种东西。图:一个具有非常简单规则集的元胞自动机(在左下角显示),产生高度复杂的行为 看到这样的图片,我们可能会感到悲观:我们人类如何能够有用地交流所有这些复杂性?最终,我们所希望的是我们能够在我们的大脑能够处理的内容和计算能够做的内容之间建立某种桥梁。虽然我没有完全以这种方式看待它,但事实证明这基本上正是我这些年来在设计Wolfram语言时一直在努力做的事情。 计算思维的语言 我认为我的角色是要识别人们会理解并想要使用的计算块,像FindShortestTour、ImageIdentify或Predict。传统的计算机语言集中在接近计算机实际硬件的低级构造上。但在Wolfram语言中,我反而从我们人类理解的东西开始,然后尽可能地在语言中捕捉它。 在早期,我们主要处理相当抽象的概念,比如关于数学或逻辑或抽象网络的概念。但近年来的一个重大成就——与Wolfram|Alpha密切相关——是我们已经能够扩展我们建立的结构,以覆盖世界上无数真实的东西——像城市或电影或动物。 有人可能会问:为什么要发明一种语言来做所有这些;为什么不直接使用英语呢?好吧,对于特定的东西,比如“热粉色”、“纽约市”或“冥王星的卫星”,英语是好的——实际上对于这些事情Wolfram语言让人们可以直接使用英语。但当人们试图描述更复杂的东西时,普通英语很快就变得笨拙了。 想象一下,即使是尝试描述一个相当简单的算法程序。一个反复的对话——“图灵测试风格”——会迅速变得令人沮丧。而直接的英语表述几乎肯定会以复杂的法律文件中找到的那种令人难以置信的复杂散文结束。图:Wolfram语言清晰简洁地指定如何创建这个图像。等效的自然语言规范复杂且容易被误解。 但Wolfram语言正是为了解决这类问题而构建的。它被设置为人类易于理解,捕捉人类描述和思考事物的方式。然而,它也具有允许组装和传达任意复杂性的结构。当然,它不仅容易被人类理解,也容易被机器理解。 我意识到我实际上已经用英语和Wolfram语言的混合物思考和交流了多年。例如,当我做报告时,我会用英语说些什么,然后我就开始打字,用一段在那里执行的Wolfram语言代码来传达我的下一个想法。图:Wolfram语言与英语在文档和思维流中很好地混合使用 了解人工智能 但让我们回到人工智能的话题。在计算的大部分历史中,我们通过让人类程序员明确编写代码行来构建程序,理解(除了错误!)每一行做了什么。但要实现可以合理称为人工智能的东西,需要利用更多的计算能力。为此,人们必须超越人类可以直接编写的程序——以某种方式自动采样更广泛的可能程序范围。 我们可以通过我们在Mathematica和Wolfram语言中长期使用的那种算法自动化来做到这一点,或者我们可以通过显式的机器学习,或者通过搜索可能程序的计算宇宙来做到这一点。但无论我们如何做,结果程序的一个特点是,它们没有理由对人类来说是可理解的。图:工程化的程序是编写成可读的。自动创建或发现的程序不一定是人类可读的。 在某种程度上,这是不安定的。我们不知道程序内部是如何工作的,或者它们可能有什么能力。但我们知道它们在做复杂的计算,这在某种意义上是不可简化地复杂的。 还有一个非常熟悉的地方发生了同样的事情:自然世界。无论我们看流体动力学、生物学或其他任何东西,我们都看到了各种复杂性。实际上,我从我所做的基础科学研究中得出的计算等价原理意味着,这种复杂性在某种意义上与计算系统中可以发生的复杂性完全相同。 几个世纪以来,我们已经能够识别自然界的某些方面,我们可以理解,然后利用它们来创造对我们有用的技术。我们对编程的传统工程方法大致以同样的方式工作。 但对于人工智能,我们必须冒险进入更广阔的计算宇宙,在那里——就像在自然世界中一样——我们不可避免地处理我们无法轻易理解的事物。 人工智能将会做什么? 让我们想象我们有一个完美、完整的人工智能,能够做任何我们可能合理地与智能联系起来的事情。也许它会从许多IoT传感器获取输入。并且内部进行着各种计算。但它最终将尝试做什么?它的目的将是什么? 这将深入一些相当深奥的哲学问题,涉及几千年来被反复讨论的问题——但最终这些问题在处理人工智能时将变得非常重要。 人们可能会认为,随着人工智能变得更加复杂,其目的也会变得更加复杂,最终人工智能会得到某种最终的抽象目的。但这是没有意义的。因为真的没有这样的抽象定义的绝对目的,能以某种纯粹形式的数学或计算方式推导出来。目的只是相对于人类及其特定的历史和文化来定义的。 一个“抽象的人工智能”,不连接到人类的目的,只会继续进行计算。就像大多数元胞自动机和自然界中的大多数系统一样,我们无法识别或归因于那些计算或执行它们的系统的任何特定“目的”。 为人工智能设定目标 技术一直都是关于自动化事物,以便人类可以定义目标,然后这些目标可以通过技术自动实现。 对于大多数类型的技术,这些目标都被严格限定,并且不难描述。但对于一个通用的计算系统,这些目标可以完全是任意的。那么挑战就是如何描述它们。 你怎么对人工智能说,你想让它为你做什么?你不可能在每一个情况下都准确地告诉它该做什么。只有当人工智能能做的计算被严格限制时,像在传统的软件工程中一样,你才能做到这一点。但为了让人工智能正常工作,它必须利用计算宇宙的更广泛部分。然后,就会出现我称之为计算不可约简的现象,你永远无法确定它会做什么。 那么为人工智能定义目标的最佳方式是什么?这很复杂。如果人工智能能够和你一起体验你的生活——看你所看到的,读你的邮件等等——那么,就像你很了解的一个人一样,你至少可以用自然语言告诉人工智能一些简单的目标。 但如果你想定义更复杂的目标,或者与人工智能已经经历的事情不紧密相关的目标呢?那么少量的自然语言就不够了。也许人工智能可以经历一整套教育。但更好的想法是利用我们在Wolfram语言中拥有的东西,实际上它已经内置了大量的世界知识,以一种人类和人工智能都能使用的方式。 人工智能之间的交流 思考人类如何与人工智能交流是一回事。但人工智能之间将如何交流呢?人们可能会想象它们可以直接传输它们的知识基础表示。但这行不通,因为一旦两个人工智能有了不同的“经历”,它们使用的表示必然至少在某种程度上有所不同。 因此,就像人类一样,人工智能最终将需要使用某种形式的符号语言来抽象地表示概念,而不是具体引用这些概念的基础表示。 人们可能会接着想,人工智能应该直接用英语交流;至少这样我们可以理解它们!但这也行不通。因为人工智能不可避免地需要逐渐扩展它们的语言——所以即使它开始时是英语,它也不会保持那样。 在人类的自然语言中,当新的概念足够普遍以至于使得在语言中表示它们变得有用时,新词汇就会被添加。有时一个新概念与世界上的某些新事物相关联(如“博客”、“表情符号”、“智能手机”、“点击诱饵”等);有时它与现有事物之间的新区分相关联(如“道路”与“高速公路”、“图案”与“分形”)。 通常是科学通过识别行为或结构的不同集群,给我们提供事物之间的新区别。但重点是,人工智能可以比人类在更大的规模上做到这一点。例如,我们的图像识别项目旨在识别我们人类日常名称的大约10,000种对象。但在内部,随着它对世界上的图像进行训练,它正在发现我们没有名称的所有种类的其他区别,但这些区别成功地做到了稳健地区分事物。 我称这些为“后语言出现概念”(或PLECs)。我认为在一个人工智能的群体中,不可避免地会出现一个不断扩展的PLECs层级结构,迫使人工智能的语言逐渐扩展。 但英语的框架如何支持这一点呢?我猜每个新概念都可以被赋予一个由某种哈希码式的字母集合形成的单词。但结构化的符号语言——如Wolfram语言——提供了一个更好的框架。因为它不要求语言的单位是简单的“单词”,而允许它们是任意的符号信息块,如示例集合(这样,例如,一个单词可以通过携带其定义的符号结构来表示)。 那么,人工智能应该用Wolfram语言彼此交流吗?这似乎很有道理——因为它有效地从人类知识发展出的世界理解开始,但然后提供了一个更进一步的框架。语法如何编码(输入格式、XML、JSON、二进制,等等)并不重要。重要的是语言中构建的结构和内容。 信息获取:十亿年视角 在地球上生命存在的数十亿年里,传递信息的方式有几种不同的方式。最基本的是基因组学:在硬件层面上传递信息。但然后有神经系统,比如大脑。这些系统通过从体验世界中积累信息——就像我们的图像识别项目——来获取信息。这是生物体用来看到世界,以及做许多其他“类人工智能”的事情的机制。 但从某种意义上说,这种机制是有根本限制的,因为每一个不同的生物体——和每一个不同的大脑——都必须自己经历整个学习过程:在一代中获得的信息不能轻易地传递给下一代。 但这就是我们人类做出伟大发明的地方:自然语言。因为有了自然语言,就有可能将已学到的信息以抽象形式传递,比如从一代传到下一代。然而,还有一个问题,因为当接收到自然语言时,它仍然需要在每个大脑中单独解释。图:信息传递:第0级:基因组学;第1级:个体大脑;第2级:自然语言;第3级:计算知识语言 这就是计算知识语言——如Wolfram语言——的想法变得重要的地方:因为它提供了一种方式,可以立即并可重复地执行地传达世界上的概念和事实,而无需接收者进行单独的解释。 可以毫不夸张地说,人类自然语言的发明引领了文明和我们现代世界的发展。那么,进入另一个层次——拥有一个精确的计算知识语言,不仅携带抽象概念,还提供执行它们的方式——会有什么含义呢? 一种可能性是,它可能定义人工智能的文明,无论那最终会是什么样子。也许这会远离我们人类——至少在我们目前的状态下——能理解的东西。但好消息是,至少在Wolfram语言的情况下,精确的计算知识语言对人类来说并不是不可理解的;事实上,它是专门构建成人类可以理解和机器可以轻松处理之间的桥梁。
2024年全球最具创新力公司 欢迎来到未来。多年来,《快公司》一直在跟踪那些承诺将改变世界但似乎总是触手可及的想法和技术。正如今年“最具创新力公司”名单所展示的,这些想法和技术现在已经牢牢掌握在我们手中。当然,有生成式人工智能,它是建立在今年排名第一的公司 Nvidia的芯片和平台之上,并由 OpenAI和 Microsoft等公司推广。新兴的人工智能公司也在留下自己的印记,无论是通过管理围绕技术的风险( Credo AI),还是创建一种全新的网络搜索方式( Perplexity)。但是,变成现实的科幻不止于此。在过去的一年里, Vertex Pharmaceuticals公司推出了市场上的第一款CRISPR-Cas9基因编辑治疗, KinetX公司帮助一艘宇宙飞船完成了44亿英里的任务,成功着陆在一颗小行星上并返回地球,而 Climeworks公司使用直接空气捕获技术从大气中清除二氧化碳。与此同时,非营利组织“四天工作周全球”做到了看似不可能的事情:说服全世界的公司采用更短的工作周。尽管新技术推动了创新,但我们对“世界50家最具创新力公司”的排名——以及记录从广告到视频各个领域的前瞻性组织的58个名单——展示了深刻的人文故事。泰勒·斯威夫特制作公司、碧昂丝的帕克伍德娱乐、Sphere娱乐和美泰公司展示了集体面对面体验的力量。 国家女子足球联盟正在将体育迷的热情推向新的高度。 联合汽车工人联盟正在推动公司在追求创新的同时,将劳工置于中心位置。而在各个领域,公司正在找到新的方式与文化连接并取悦消费者,从塔可钟和J.M. Smucker的玩味食品到Chess.com努力将几个世纪的游戏转变为必看的现实电视。面对商业和地球面临的挑战是巨大的,但选择这些获奖者的过程给了我们乐观。我们希望您也能得到类似的启发。Top 10: 1. Nvidia (英伟达) 提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。 2. Novo Nordisk (诺和诺德): 专注于糖尿病护理和其他慢性疾病,改善全球健康。 3. Microsoft (微软):科技巨头,塑造计算、游戏和商业解决方案的未来。 4. United Auto Workers (全美汽车工人联合会): 为汽车工业工人权利倡导的劳工联合会。 5. National Women's Soccer League (国家女子足球联赛): 美国顶级的职业女子足球联赛。 6. Gensler (詹森): Gensler是国际著名的建筑设计、规划与咨询公司,无比专注于通过其设计促进客户业务的成功。 7. YouTube (油管): 世界领先的视频分享平台,转变了媒体消费和创造。 8. Taco Bell (塔可钟): 以创新和玩味的方式著称的墨西哥风味快餐连锁店。 9. OpenAI (开放人工智能): 人工智能研究公司,核心宗旨在于“创建造福全人类的安全通用人工智能(AGI)”。使命是建立安全有益的AGL,确保通用人工智能造福全人类。 10. KinetX (KinetX): 专注于航天技术,对太空探索和导航做出贡献。 原网址: http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.fastcompany.com%2Fmost-innovative-companies%2Flist&urlrefer=f3efb7fc0566cd713952762a46d49d9e
矽智能何以跻身全球AI制药第一梯队 美国最具影响力的商业媒体之一《快公司》日前公布2024年“最具创新力”公司榜单,涵盖58个细分行业和赛道。研发中心设在上海张江的人工智能药物发现与设计(AIDD)公司英矽智能,与英伟达、OpenAI等公司一同入选,并登上“最具创新力”生物科技公司Top10榜单。 凭借自主研发的一体化AI算法平台,英矽智能于去年6月启动了全球首款AI药物的二期临床试验。这款候选药物从立项到被提名临床前候选化合物只用了18个月,耗时仅为传统药物研发的三分之一。不久前,国际权威期刊《自然·生物技术》披露了该药在临床前实验和部分临床试验中的数据和表现。 “AI+医药”被英伟达创始人黄仁勋多次认证为“下一个黄金赛道”,他甚至表示,“人人都必须学会计算机的时代过去了,人类生物学才是未来”。在AI制药这条“黄金赛道”上,跑进第一梯队的英矽智能是怎么做到的?“完美开局”后,又将如何保持长期优势?为此,记者来到英矽智能上海公司,与公司创始人兼首席执行官、加拿大科学家亚历克斯·扎沃洛科夫进行了对话,他的回答是:扎根上海,永远保持对前沿技术的追求。 罕见“双CEO架构”,兼顾行业快与慢 AIDD的热度正席卷全球。据统计,目前全球有超过800家AIDD企业,2022年吸引投资59.3亿美元。仅去年一年,英伟达就投资了8家药物发现初创公司。英矽智能是唯一一家采用“双CEO(首席执行官)架构”的公司,原因很简单:为了兼顾人工智能与生物医药的发展节奏。 当前AIDD公司商业模式主要有三种:一是以提供软件平台服务为主的SaaS供应商,二是以开发内部管线为主的生物技术公司,还有一种是AI驱动的CRO(研发合同外包服务机构)公司。这些公司的发展策略要么偏AI,要么偏生物医药。扎沃洛科夫认为,AI与生物医药的发展速度不一样,一个非常快,一个相当慢,两者必须融合发展。扎沃洛科夫是计算机和商业双学位出身,他的创业之路始于2013年,这也是业内公认的这一轮生成式人工智能(AIGC)革命的起点,那一年他35岁。3年后,扎沃洛科夫撰写的首篇将AIGC应用于药物研发的概念性论文,获得了2013年诺贝尔化学奖得主迈克尔·莱维特的点评,这也为后来莱维特成为英矽智能的科学顾问埋下了伏笔。 在物色生物医药方面的人才时,扎沃洛科夫将目光投向上海。一时间,猎头、同行纷纷向他举荐人才,他亲自面试的就有30位人选。2021年,任峰以首席科学官的身份进入英矽智能,此前他曾在跨国药企葛兰素史克和全球性CRO美迪西任职。 任峰的加入让英矽智能新药研发的面貌焕然一新,仅用6个月,他就带领团队在AI引擎的帮助下提名了两个临床前候选药物。 2022年,扎沃洛科夫做出一个大胆决定,举荐任峰为公司联合首席执行官,此后由扎沃洛科夫负责算法,任峰主攻药物发现。“双剑合璧”下,英矽智能的发展进一步提速。截至目前,公司已搭建涵盖30余条管线的多元化疗法组合,提名18款临床前候选化合物,并将其中6个领先项目推进到临床阶段。 亲历竞速挑战,被张江药谷“实力圈粉” 2017年,扎沃洛科夫在美国遇到了药明康德创始人李革博士。李革要求扎沃洛科夫在最短的时间内用AI算法针对DDR1激酶靶点设计化合物,如果化合物有活性,英矽智能将收获新一轮投资。在双方团队的通力协作下,扎沃洛科夫在46天里完成了这场AI药物设计的竞速挑战,借此,他也被张江药谷“实力圈粉”。 2020年,英矽智能上海公司成立,扎沃洛科夫用三个“如此”回答选择上海的理由:张江有如此多的CRO、如此多的人才、如此充满活力和努力工作的社群。他觉得许多不可能实现的事,在这里都能做成。如今,英矽智能将75%的公司资源投入到药物研发上,而负责药物发现和验证的,主要是以上海为中心的长三角地区团队。 目前,在AIDD公司的三种主要商业模式上,英矽智能都有所斩获:全球11家大型跨国药企,包括礼来、诺和诺德都引进了英矽智能的AI制药系统;公司内部多条药物管线正在推进,并与复星医药、赛诺菲等大药厂合作进行药物研发;▼下转第四版(上接第一版)与意大利制药巨头美纳里尼和美国上市公司Exelixis达成的AI药物对外授权合作为公司带来了高额首付款……此外,公司还将AI应用拓展到了再生农业、可持续化学等领域,先后与先正达集团、沙特阿美达成了合作。 正在布局两件事,永远保持对前沿技术的追求 前沿技术对扎沃洛科夫有着致命的吸引力。他没有固定住所,每天只睡4小时,业务在哪里他就飞到哪里;他的名片上印有刻度和两个正六边形,这是为了随时随地都能画出化学分子式;他还喜欢写书和写专栏,早在10多年前,他就思考过如何阻止AI毁灭人类…… 谈到英矽智能的愿景,扎沃洛科夫聊起了对“失去感”的怅然。他希望能够解决人类的衰老问题,并认为计算机科学是解决这一问题的关键。 “对抗衰老,就是与所有疾病为敌。”扎沃洛科夫打了个比方,想要战胜病魔,需要发现敌人、研发武器、与敌人战斗。对应到英矽智能的AI制药系统,就是靶点发现平台、小分子化合物设计和生成平台,以及临床试验预测平台。在给这些平台起名时,扎沃洛科夫用“42”取代AI——在经典科幻小说《银河系漫游指南》中,“42”象征着生命、宇宙以及任何事情的终极答案,他要解开的也是关乎人类终极奥秘的大问题。 眼下,英矽智能正在布局的两件事或许将引来行业的再次瞩目。一是构建完全由机器人运行的湿实验室,与AI虚拟筛选的干实验室互补;二是探索更多前沿技术与已有算法的融合,如量子计算、大模型等驱动的药物发现突破。前不久,公司团队在论文中透露,他们将量子计算模型整合到英矽智能小分子生成引擎Chem istry42中,以探索和确认药物发现过程中量子计算模型的优势。 扎沃洛科夫判断,量子计算将是下一个对所有行业产生巨大影响的技术突破,制药业将是第一波受益于这一颠覆性技术的行业之一。 --- 图:英矽智能何以跻身全球AI制药第一梯队© 由 人民资讯 提供 英矽智能Life Star1实验室。 (受访者供图) 本帖转自人民资讯 本报记者 沈湫莎
OpenAI-Microsoft 合作伙伴关系解释 OpenAI 和 Microsoft 从商业角度进行了合作。 合作伙伴关系的历史始于 2016 年,并于 2019 年得到巩固,微软向该合作伙伴关系投资了 10 亿美元。 它现在向前迈进了一大步,微软正在商谈向这一合作伙伴关系投入 XNUMX 亿美元。 微软通过 OpenAI 开发其 Azure AI 超级计算机,同时增强其 Azure Enterprise Platform 并将 OpenAI 的模型集成到其 商业 和消费产品(GitHub、Office、Bing)。考虑到 OpenAI 的混合结构,即 LP 和非营利实体,OpenAI 和微软之间的交易可能非常特殊。 事实上,在 10 年投资 1 亿美元以获得独家商业许可以分发 OpenAI 产品之后,微软似乎正在谈判向合作伙伴关系投入 2019 亿美元。 交易结构可能是微软以 10 亿美元注资或基础设施支持,这可能使微软有权获得 OpenAI 75% 的利润,直到它收回投资。 在那之后,它可能会给微软 49% 的权利 利润 未来分享直到达到上限(OpenAI 是一个营利性的,有上限的组织), 之后,所有的利润都被 OpenAI 收回。 微软如何从 OpenAI 投资中获益? 放人工智能 商业模式 沿着三个主要部分移动: -OpenAI API。 -ChatGPT。 -以及 Microsoft/OpenAI 商业合作伙伴关系。 OpenAI 构建了人工智能行业的基础层。 借助 GPT-3 和 DALL-E 等大型生成模型,OpenAI 为希望在其基础模型之上开发应用程序同时能够将这些模型插入其产品并使用专有数据和其他 AI 自定义这些模型的企业提供 API 访问特征。 另一方面,OpenAI 还发布了 ChatGPT,围绕免费增值模式进行开发 模型. 微软还通过其商业合作伙伴关系将 opener 产品商业化。 因此,要全面了解 OpenAI 商业 模型,了解 OpenAI/Microsoft 合作伙伴关系迄今为止的运作方式及其扩展方式至关重要。微软是OpenAI LP的主要投资者,这是一个营利性但有上限的实体,由 OpenAI 基金会创建,旨在从私营部门筹集资金。 2019 年,合作伙伴关系得到加强,微软向合作伙伴关系投入了 XNUMX 亿美元。 这给了微软各种优势。 与此同时,到 2022 年,微软正在商谈向合作伙伴关系再投资 10 亿美元。 讨论结束,因为微软确认它对 OpenAI进行了多年、数十亿美元的投资,该投资正沿着三大支柱发展: -超级计算在规模. -新的人工智能体验. -独家云提供者.微软在此前于 2019 年和 2021 年进行的投资之后进行了多年、数十亿美元的投资,将使我们能够继续独立研究和开发越来越安全、有用和强大的 AI。 它进一步解释说:我们合作构建了多个由 Azure 提供支持的超级计算系统,我们用它来训练我们所有的模型。 从现实世界的使用中学习——并吸取这些教训——是开发安全有用的强大人工智能系统的关键部分。 为了构建和部署安全的 AI 系统,我们的团队定期合作审查和总结共享的经验教训——并使用它们为我们的系统的迭代更新、未来的研究以及在整个行业中使用这些强大的 AI 系统的最佳实践提供信息。
开新地, 地价上涨 据说要开新地了 1000w 同时旧地也要涨价了
不是每一台PC都叫AI PC!这些玩法 只有Intel才能做到 AIGC、AI PC风起云涌,整个半导体行业都在抓住这个千载难逢的良机。从上游芯片企业,到广大设备厂商,再到生态软硬件公司,以及各种机构组织,无一不倾尽全力。 无论是AIGC,还是AI PC,根基都是强大底层硬件和算力的坚实支撑,动力则是广阔生态支持和应用场景的落地,软硬结合,才能真正释放AI的潜力,才能真正颠覆千行百业的体验。 作为几十年来半导体行业执牛耳者,Intel可以说是“天选之子”,CPU+GPU+NPU三大计算引擎组成XPU算力平台,无与伦比的号召力和影响力则是一呼百应。 Intel倡导的AI PC已经得到数百家IHV独立硬件供应商、ISV独立软件供应商和大量独立开发者的鼎力支持,基于酷睿Ultra的AI PC产品将在今年达到230多款,专属的AI加速功能将超过300项。 可以说,对于AI PC能干什么,尤其是酷睿Ultra AI PC能干什么,Intel已经给出了初步的答案。接下来,我们就通过几个实例,感受一下酷睿Ultra AI PC的能耐。 一、个人专属、越来越智能的Office AI助手 来自欧非思(Extended Office)是一家专注于开发Office扩展和增强工具的软件公司,最著名的产品包括Kutools for Word/Excel/Outlook、Office Tab。 其中,Kutools针对Intel平台进行了专属的深度优化和定制,引入了一系列革命性的AI功能,包括数据处理、文档编写、邮件回复等。 这些AI功能不仅可以理解和执行复杂的指令,还能学习用户的使用习惯,从而提供更个性化的支持,持续提升效率,而且都是完全基于本地AI能力,提高办公效率的同时还有利于保护隐私安全。 值得一提的是,Kutools目前仅针对Intel AI PC平台进行优化支持,在其他平台上是看不到的。二、你的PC里有了一个专业法律助手 中科创达是全球领先的智能操作系统产品和技术提供商,聚焦边缘计算和AI关键技术,服务行业智能化升级。 该公司针对法律行业场景,基于基础语言大模型,结合百万条法律大数据,训练出了AI PC端侧的魔方智能法务助手。 它可以提供法律案件分析、法律文书撰写、法律建议提供的功能,提升法务工作人员的效率,并特别针对Intel AI PC的性能和使用场景进行了针对性的优化。 比如租房时与房东签订租房合同,只需输入相关信息和特定要求、条款,法务助手就可以生成一份专业、详尽的合同,再也不用网上到处搜索甚至购买合同模板了。 再比如面对复杂的商业法律案件,法务助手可以快速、精准地进行案例的分析和解读,并提供专业的法律建议,以及所依据的法条。 不是每一台PC都叫AI PC!这些玩法 只有Intel才能做到© 由 快硬件 提供 三、SD文生图更高清 更快速 文生图可以说是AIGC最典型、最广泛的应用,它通过SDXL-Lightning实现高画质快速生图,最新算法只需两步即可搞定,还可以实现图生图、可控图生图、局部重绘等功能。 甚至可以集成超分辨率算法,能在图片生成后再进行超分辨率采样,继续获得更高分辨率的精美图片,设置为壁纸都毫无问题。 酷睿Ultra AI PC平台上,AI生图可利用Intel Pytorch扩展模块,发挥锐炫核显的能力,只需4秒钟左右就可以生成1024×768分辨率的高画质图片,6秒钟左右可以搞定1024×1024高清图。 相比之下,竞品平台生成512×512尺寸的图片一般都需要2.5秒钟左右。四、复杂图片 飞快处理 除了AI图片生成,AI图片处理也已经得到了深入的发展和广泛的应用,尤其是在Intel AI PC平台上,可以快速完成对复杂图片的处理,大大节省工作时间。 绘世启动器是由秋叶、喵喵等国内AI绘画社区爱好者开发的一款免费AI绘画启动器软件,极大地降低了AI绘画的使用门槛,已率先支持酷睿Ultra核显加速。 Stable Diffusion WebUI开源项目最核心的优势就是丰富的社区生态,拥有量辅助AI绘画创作的衍生功能。 举个例子,我们可以利用ControlNet文生图插件,对一张老虎图片进行深度信息提取,从而得到深度图,再改变关键字,就可以生成狮子、猎豹等其他动物的图片,构图和轮廓都和深度图符合得非常好。 当然,这只是Stable Diffusion WebUI强大社区生态的冰山一角,无论是开发者还是创作者,都能从中获益匪浅。五、聪明的本地大语言模型 看图说话小菜一碟 其实,如今的本地大语言模型都已经非常智能,可以脱离云端处理各种复杂任务,看得懂文字,听得懂语言,甚至可以看图说话,典型的就是多模态大模型应用。 比如打开一张梵高1890年创作的名画《奥维尔的绿色麦田》,让大模型猜猜描绘的是什么季节、是谁画的,都能迅速给出准确的答案,甚至都可以给出简短的描述。 比如打开一张长城的图片,让大模型给出一份旅游攻略,立刻就会告诉你怎么玩。 比如打开一张红烧肉的图片,让大模型给出一份菜谱,马上就会出现详细的步骤。六、离线多轮对话 AI越来越像个人 AI PC的一个核心应用场景就是人机对话,可以通过简单的语音或文字输入,获得各种问题的答案,大大提升交互效率和准确度。 如今在酷睿Ultra AI PC平台上,本地化的AIGC助手不但可以快速给出所需要的答案,而且已经支持离线多轮上下文对话,而不再是一次又一次的一问一答。 比如驱动人生在Intel平台上打造了一款AIGC助手,可预先加载百川2-7B等本地化大模型,可设置中英文语言、CPU/GPU推理设备、最大输出长度等,还支持语音播报。 举个例子,我们首先让它推荐北京的三个旅游景点,得到答案后,直接再让它详细介绍第一个景点,它就会自动识别到故宫,然后开始介绍。 这无疑更像是人类自然对话,AI助手也变得有人情味儿了。通过以上几个简单的例子可以看出,AI PC虽然还处于起步阶段,但是生态软件和应用场景已经迅速丰富起来,在各行各业都有了蓬勃发展。 无论你是普通消费者,还是创作者、行业人士,无论你想日常办公、娱乐,还是内容创作、处理专业问题,AI PC都能成为你的好帮手。 尤其是Intel,凭借强大的硬件支撑与行业号召力,生态优势更加凸显,正在带动AI PC衔枚疾进,未来更加可期。
从0到1的飞跃 商用AI PC:开启未来更多可能 作为 PC 市场的一个重要分支,商用 PC 与“消费级” PC 的区别从设计到性能、安全可靠,再到软件生态都存在差异。步入 AI PC 时代,商用 AI PC 也延续了这个“传统”,同属 AI PC 对比其他产品,也是既相似又不同。 在 3 月 26 日举办的“ 2024 全新英特尔商用客户端 AI PC 产品发布会”上,英特尔将基于酷睿 Ultra 处理器的 AI 特性延展到商用领域,赋能商用 PC 创新。 与先一步亮相的消费级 AI PC 相似,商用 AI PC 也需要酷睿 Ultra 处理器 CPU、GPU、NPU 三大引擎加持的多元化 AI 算力,以及英特尔与 OEM、ISV 携手共建的生态作为支撑。值得关注的是,在应用场景以及产品的创新维度方面,英特尔与合作伙伴则围绕商用需求给出了更明确的定位和描述。 本次发布会上,英特尔便携手超过 35 家 ISV、10 家 OEM 展示了六大 AI 场景以及 AI 行业应用,同时英特尔基于 AI PC 的实际落地情况提出了经济、物理、数据保密三大法则,强调本地化生成式 AI 的必然性。对于处在发展早期的 AI PC 行业而言,这些布局能够在某种程度上加速商用 AI PC 落地,将设备的 AI 算力转换为生产力。 六大 AI 场景 +AI 行业应用 英特尔围绕商用 AI PC 提出的六大应用场景包括—— AI Chatbot、AI PC 助理、AI Office 助手、AI 本地知识库、AI 图像视频处理、AI PC 管理。尽管与消费级应用场景存在重叠,但英特尔与软硬件合作伙伴还是充分考虑到了商用场景的特殊需求。例如,无论是六大场景还是 AI 行业应用,发力点都与商用客户的工作流程、业务内容有更紧密的相关性,比如天极网在现场体验的 AI 法务助手。通过本地化大模型部署,一方面可以节省律师根据案件卷宗梳理内容的时间,提升效率,同时也可以快速满足“没有法律专业知识”用户撰写合同文档的需求,可以说大模型既作为效率工具,又扩展了用户的知识、技能体系,可以解决用户在某些专业领域的需求。另一方面,本地化部署、无网正常使用等端侧特性,对于数据隐私敏感的律师等行业用户而言,更为安心,且可以在更多应用环境下发挥大模型的效率优势。 与商用 PC 的客制化属性相似,商用 AI PC 的客制化不仅体现在硬件方面,客户对软硬应用的部署也有更清晰的需求,通过英特尔与 ISV 和 OEM 的深度合作优化,获得“ 1+1>2 ”的效果。比如在 AI PC 管理方面,ISV 将安全扫描等负载分配到 NPU 后,可以有效缓解 CPU、GPU 压力,对于普遍的多任务处理而言,将更多可调用的算力资源交由使用者分配,从而提升整体流畅度。 还有 AI 行业应用,例如教育行业中,构建在 AI PC 终端的大语言模型,可以大幅提升教师备课效率,提高备课质量,为缓解教师的工学矛盾和实现优质教育资源的共享作出贡献 ; 医疗医药行业中,通过在 AI PC 上部署大模型帮助新药靶点发现,提升医生和科研人员在药物研发阶段的效率 ; 康复养老行业中,产业基于 AI PC 通过动作捕捉对老人健康进行评估与康复健身运动指导,用技术赋能老人健康 ; 政务办公场景,考虑到数据隐私管控的需求,AI PC 终端非常适合部署本地大模型,提升政务办公效率,惠及民生,从而提供新质生产力。 英特尔将 AI 特性延展到商用领域,携手合作伙伴打造 AI PC,不仅是硬件 Ready,软件、应用、工具等生态也同步“ Ready ”,从而实现商用 PC 的飞跃。英特尔客户端事业部副总裁兼细分市场部总经理冯大为在接受天极网采访时提到,商用 PC 的迭代周期更长,目前企业部署且在用 PC 中有超过半数的使用时间达到 4 年以上,选择商用 AI PC 对于众多企业而言是完成了“ 0 到 1 ”的飞跃,换新后会获得并且是几年内都具备基于 AI 的高效生产力、算力,而且在后续迭代升级中,结合商用 AI PC 的换新周期可能会实现从 1 到 3、4 的跃迁,企业、商用客户仍能获得满意的生产力提升。 另外,冯大为还指出大模型、生成式 AI 等端侧 AI 在商用 PC 领域的大规模落地应用,在 PC 过去发展的几十年中从未出现,这项堪称颠覆式的创新,也让英特尔对于未来市场充满期待。还有一点值得关注,尽管在“ 0 到 1 ”的过程中,涌现了大批全新应用,需要新一代架构的支持才能高效运行。但未来企业升级商用 AI PC 后,并非只能依靠缩短迭代周期来获得生产力提升。北京智谱华章科技有限公司首席运营官张帆在采访中提到,大模型与其他 AI 应用存在一个重要区别,即使算力没有升级,但通过优化迭代,其能力会持续提升。例如,几天 6B 的模型或许已经具备一年前百亿模型的能力,甚至更胜一筹,并且通过云端与终端的协同配合,AI PC 在同等硬件配置下的增长空间非常大。星环科技副总裁杨一帆也提到,大模型以及整个 AI 行业还在快速发展,随着数据质量提升、训练投入增加、技术持续创新,模型也在不断进化,AI PC 的潜力也将在这个过程中持续释放。 这也就很好地解答了另一个问题——商用客户为什么选择 AI PC? 从体验角度来看,商用 AI PC “ 0 到 1 ”的突破与持续释放的生产力,对于追求高效的企业、商用客户而言已经展现出足够的生产力。但英特尔“王牌”不止 AI,还有 vPro 平台。基于英特尔酷睿 Ultra 的 vPro 平台,将 AI 和商用平台的生产力、安全性、可管理性和稳定性结合,换言之对于企业 IT 终端升级是“额外加量”。 加速 AI 落地最后一公里 英特尔公司市场营销集团副总裁、中国区云 & 行业解决方案部总经理梁雅莉在主题分享中提到,英特尔推动 AI PC 落地的初衷是加速 AI 落地的最后一公里。技术不是为了技术而生,技术是为了我们每个人而生。AI PC 能够落地,并且有丰富功能、实用应用支撑是其最大的吸引力,但做到这一点就需要硬件、软件、工具的协同布局,然而这恰巧就是限制 AI PC 发展的“最后一公里”。 尽管应用场景快速丰富,但用户、客户、行业心中仍有疑问—— AI PC 究竟能做什么?或者说怎么用才能获得 AI PC 而不是 PC 的体验。 目前来看,大模型、生成式 AI 如果交由用户部署仍有门槛,即使是有明确行业需求的商用领域,这一步也需要 OEM 与 ISV 加紧合作。从几年前英特尔发布会第十代酷睿起,PC 端 AI 部署便持续推进,越来越多软件应用集成 AI 功能,但诸如性能、功耗、地域性、交互习惯等难点让 AI 的普适之路并不顺畅。 英特尔中国区技术部总经理高宇在采访中也提到,对于 AI PC 行业而言,一个很大的挑战就是如何来做软件的优化,AI PC 要求 PC 行业必须完成从芯片到驱动,到工具链,到应用之间的垂直型优化。让人期待的是,解决包括 AI PC 带来的“新挑战”以及 AI 落地 PC 的“老难题”过程中必不可少的各个环节优化、合作,恰好是英特尔最擅长、最强大的地方。所以,在商用 AI PC 或者说整个 AI PC 行业还处在早期阶段时,我们就已经能够看到持续增加的应用和不断丰富的场景。 总而言之,或许当下 AI PC 对于部分商用客户而言与传统 PC 的差异还未拉开,但随着商用 AI PC 软硬件生态的持续完善,痛点逐步解决,未来商用 AI PC 带来的将不仅是生产力提升,还有更多可能性,比如 PC 产品形态、交互方式的创新,用户获取软件、AI 应用渠道的完善 ... 届时商用 AI PC 也将遍地开花,惠及千行百业
【违规】违规用户封禁处理公告 亲爱的chatgpt吧吧友们: chatgpt吧始终坚持公平、公正、透明的原则,并致力于营造一个开放和包容的交流环境,确保社区的健康和秩序。因此,在处理违规行为时,我们采取了一系列措施,以确保每一项决策都是经过仔细考虑和公正处理的。同时我们一直坚持尊重和保护吧友的发帖自由原则。然而,尽管我们的努力不懈,仍有一部分吧友的行为违反了社区规定。对此,我们感到非常遗憾,但为了维持社区的健康发展和良好秩序,我们不得不采取暂时“封禁”的方式来对这些违规行为进行 提醒。 请理解,封禁措施并非我们的目标,而是作为最后的手段,目的是为了提醒吧友们重视和遵守吧规,以促进一个更加积极、健康的交流环境。我们仍然坚信,通过大家的共同努力,可以实现理解、尊重并遵守规则的社区文化。 以下行为将视为违规,可能导致警告或封禁,是对吧规的补充条目: 1. 辱骂和恶意攻击其他吧友。 2. 在帖子的第二楼发布广告或宣传内容,与主题无关。 3. 在帖子的第三楼以下恶意挖坟,即回复长时间没有活动的帖子。 4. 恶意刷帖,多次发布相同或无关的内容,以提高帖子的点击率。 5. 发布恶意广告,推广违规产品或服务,包含引流第三方平台链接。 6. 分享包含不实信息的帖子,散布虚假信息。 7. 发布与贴吧主题无关的内容,破坏了讨论的连贯性。 8. 分享违法信息,如侵犯版权、色情内容等。 9. 恶意灌水:发布无意义、毫无内容的回复,以占用帖子空间或干扰讨论。 10. 侵犯隐私:发布他人的个人信息,如电话号码、地址等,违反了隐私权。 11. 恶意举报:故意举报其他吧友或帖子,以恶意损害其声誉。 12. 冒充他人身份:伪装成其他吧友或虚构身份,进行虚假发言(互捧,刷帖,广告)或欺骗行为。 13. 挑起争端:故意制造争吵、冲突或纷争,破坏和谐氛围。 14. 涉及政治敏感话题:发布政治敏感内容,违反了贴吧关于政治讨论的规定。 15. 广告帖重复发布:多次发布相同或类似的广告帖,以增加曝光。 16. 无意义信息:发布大量重复内容,垃圾信息、链接或与帖吧主题不相关内容。 17. 妨碍吧务组工作:删除吧务的留言,拉黑吧务,辱骂吧务。 【 申诉渠道】 如果被封禁的吧友认为有误会或可以承诺今后遵守吧规,欢迎通过以下方式申诉: - 联系方式#1:直接私信吧务团队 - 联系方式#2:提交申诉 我们将在核实情况后,对符合条件的申诉进行解封处理。 再次提醒:遵守吧规是每一位吧友的责任和义务。我们希望在尊重每位吧友发帖自由的同时,我们共同维护一个有序、健康的交流环境。 感谢大家的理解与支持!
OpenAI的“企业年”包括提高人工智能准确性的新工具 OpenAI的企业客户如果希望使用生成式人工智能,但又希望获得更高的准确性,或许可以通过GPT-4 API的新定制选项来实现。其中包括连接第三方平台以共享微调信息的能力、在额外训练期间保存微调模型而无需重新训练整个模型的能力,以及比较模型性能和质量的新用户界面。OpenAI API 于 2020 年推出,允许公司在其大型语言模型的基础上进行连接和构建,随后于去年 8 月开放了 GPT-3.5 的微调功能,最终还将开放GPT-4。 高度定制的模型可以在内部提供更好的结果。它们还能使对公众的回复保持在正轨上,避免出现像由ChatGPT 支持的雪佛兰经销商的机器人说它会以 1 美元的价格卖出一辆车那样的尴尬情况。 今天,OpenAI 首席运营官 Brad Lightcap在接受彭博社采访时表示,2024 年是"企业年",因为企业开始推出更多使用基础模型的用例,OpenAI 在该领域看到了"巨大的增长"。Lightcap说:"我们越来越感觉到,市场正在把我们拉向真正的应用,提供真正的业务成果,真正广泛地关注人工智能赋能,我们已经准备好为我们的客户提供支持。" Lightcap此前曾警告企业高管不要指望人工智能能解决他们的所有问题,并提醒说,生成式人工智能在很大程度上仍处于试验阶段。 OpenAI 还正式宣布了辅助微调功能,作为定制模型计划的一部分,OpenAI 员工将帮助客户对 GPT-4 进行微调。定制模型计划允许选定的组织与 OpenAI 研究人员合作,根据其特定需求训练定制的 GPT-4 模型。 通过微调,GPT-4 等预训练模型可以通过更小、更有针对性的数据集(如公司的投资组合)学习更多信息。第一个第三方集成是与 Weights & Biases 平台的集成。 虽然 OpenAI 以 ChatGPT 而闻名,吸引了日常消费者和希望创建自己版本聊天机器人的品牌,但该公司也与初创企业和更成熟的组织合作,将人工智能驱动的应用和服务引入主流。 生成式人工智能时代最早的一些宠儿,如文案撰写平台 Jasper和视频创作公司 Descript,都是利用 OpenAI 的模型构建自己的服务的。
AI在游戏开发中的应用:创造更智能的虚拟世界 随着人工智能(AI)技术的飞速发展,游戏产业正在经历一场前所未有的变革。AI技术不仅在游戏玩法和体验上带来革命性的改进,还在游戏开发过程中发挥着越来越重要的作用。特别是虚幻引擎中的AI工具,为开发者提供了强大的支持,使他们能够以前所未有的速度和效率创造出丰富多彩的虚拟世界。本文将探讨AI在游戏开发中的应用,并展望其如何推动游戏产业向更智能的虚拟世界迈进。程序生成:无限可能的世界创造 游戏中的程序生成技术是AI应用的一个亮点。通过这项技术,开发者可以利用算法自动生成游戏内的地形、建筑、任务等内容,从而极大地提高开发效率,减少人力和时间成本。 数字人动画师:赋予虚拟角色生命 虚幻引擎中的数字人动画师(MetaHuman Animator)则是另一个AI技术的突破,它能够帮助开发者轻松创建逼真的数字人物。 AI生图技术:创新游戏设计 AI生图技术的融入,为游戏设计带来了新的可能。玩家可以直接利用AI技术根据描述生成图片,进而在游戏中构建独特的场景和角色。这种方式不仅激发了玩家的创造力,也让游戏世界的构建变得前所未有地灵活和多样化。面临的挑战与解决方案 尽管AI技术在游戏开发中的应用充满了光明的前景,但也面临着诸如资产管理复杂化、新工具的学习曲线等挑战。 展望未来 随着AI技术的不断进步和应用,未来的游戏开发将变得更加智能化和高效。AI不仅能够帮助开发者创造出更加丰富多彩的游戏世界,还能够在游戏设计、角色创建、甚至是故事叙述等方面带来创新。未来,我们可以期待出现更多结合AI技术的游戏作品,它们将为玩家提供更加真实、创意和沉浸式的游戏体验。 AI技术的融入不仅仅是游戏开发领域的一次技术革新,更是对游戏产业未来发展方向的一次有力预示。随着技术的不断成熟和开发者对这些工具的深入探索,我们有理由相信,AI将会在创造更智能、更引人入胜的虚拟世界方面发挥越来越重要的作用。 --- (一览ai原创)
首页
5
6
7
8
9
10
下一页