秩序与自由
低不语
多看一眼,可能就是最后一眼
关注数: 104
粉丝数: 2,776
发帖数: 24,663
关注贴吧数: 581
28周Pro还要等多久
YU7是你第几台车 是我第一辆新车
怎么给珍稀幻兽升星啊,只能去商店买xo吗,那不是很贵
居然是极限组
豆包可以实时语音了(可随时语音打断) 之前星火先出的,但星火不够有感情
新高定是抄的K? 白发 黑衣 墨镜 火焰,这是照抄的吧?但为啥抄的那么娘化
啥时候公测啊,2025年了
啥时候出卡雷拉GT啊 玩这游戏就等这一辆车
明明国际版支持那么多语言的语音,为啥国内版只有中英文,生气😡
和天下3画质也没提升啊? 提升在哪里了?🤔
鹿铃设计得真的很丑啊…… 想抄可莉却是一点都没抓到精髓,还找了花铃来配音。
我真的不喜欢全是打副本的mmo 野外BOSS和砍人才是mmo的真正精髓
诛仙世界三测优化了不少,至少不会再比二测差了
这里是电视剧吧,游戏吧请看置顶帖回归玩家玩什么比较好
你们使用豆包和其他软件对比,哪家强 比如腾讯元宝 阿里通义 百度文心 还有 kimi 这些对比 我感觉豆包强他们一大截
o1模型工作机制谷歌8月份就发现了 发布不到1周,OpenAI最强模型o1的护城河已经没有了。 有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。 这项研究表明,增加测试时(test-time)计算比扩展模型参数更有效。 基于论文提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个14倍大的模型。 网友表示: 这几乎就是o1的原理啊。 众所周知,奥特曼喜欢领先于谷歌,所以这才是o1抢先发preview版的原因? 有人由此感慨: 确实正如谷歌自己所说的,没有人护城河,也永远不会有人有护城河。 就在刚刚,OpenAI将o1-mini的速度提高7倍,每天都能使用50条;o1-preview则提到每周50条。
为什么有的智能体介绍是一个神秘的智能体 不可描述?
字节也要研发芯片了,大力出奇迹 字节跳动正专注于研发自己的人工智能芯片,计划通过与台湾半导体制造公司合作,减轻对昂贵的 Nvidia 芯片的依赖,从而在中国的人工智能市场中获取更大的竞争优势。
推理成本持续下降 推理成本在持续下降。今年相比于去年,在推理阶段产生单位智能的成本基本上降了一个数量级,明年估计还会再有一个数量级的下降。它会让AI商业模型更成立,获得智能成本的会越来越低,但同时产生的智能越来越高。对于用户来讲,ROI就会越来越高,所以用AI的会越来越多,我觉得这是一个很重要的趋势。
大家有没有私藏的智能体分享一下啊
大家现在还在玩的 mmo 是哪些? 目前都没在玩了,最后在玩的是逆水寒手游
一个真正的前沿模型的入场价格大约是 1000 亿美元 Larry Ellison 谈大模型:对于任何想要在这个领域竞争的人来说,一个真正的前沿模型的入场价格大约是 1000 亿美元。让我重复一遍,大约 1000 亿美元。这是未来四五年内任何想要参与这场竞赛的人的成本。这是一大笔钱。而且它并不会变得更容易。 我认为这是一场持续的技术优势之战,将由少数公司和也许一个国家,在未来至少五年内进行,但可能更像是十年。所以这个业务只会越来越大,没有放缓或转变即将到来。
Reflection 70B在发布后一天内遭到了质疑和指责 Reflection 70B作为自称的开源AI模型之王,其性能在发布后的短短一天内遭到了质疑和指责,称其存在“欺诈”行为。尽管HyperWrite的联创Matt Shumer在社交媒体上称该模型表现卓越,但第三方评估却未能重现其声称的卓越性能。随后的调查显示,模型的权重在上传过程中出现问题,并且对其初始性能的评估存在严重不确定性,引发了广泛的社区讨论和指控。 关键点- Reflection 70B是由初创公司HyperWrite推出的,号称为世界顶级开源语言模型。- HyperWrite的CEO Shumer声称此模型经过“反射调优”训练,提高了多个任务的准确性。- 第三方评估机构Artificial Analysis对该模型的性能进行了独立测试,其结果明显低于HyperWrite的初始声称。- Shumer表示,模型权重在上传到Hugging Face时受损导致性能差异。- Artificial Analysis获悉的私有API测试虽然显示出良好的性能,但与初始声称的水平不符。- 社区用户质疑Reflection 70B的来源,有指控其实际上是Llama 3的变种而非Llama 3.1。- 部分用户公开指责Shumer在AI研究社区中的欺诈行为,引发了广泛讨论。
字节再试硬件:探索 AI 耳机、眼镜等产品,与豆包大模型联动 探索 AI 耳机、眼镜等产品,与豆包大模型联动,字节正在探索将大模型与硬件结合,既自己开发 AI 硬件,也会与外部硬件公司合作。 字节 AI 硬件相关团队负责人为 Kayden(花名),他正带领团队开发一款与豆包大模型和豆包 App 联动的智能耳机。Kayden 同时在推动豆包大模型与其它手机厂商的智能助手合作,类似 OpenAI 与苹果的结合。 字节同时在探索 AI 眼镜方向,可能会投资一家新公司或组建内部团队。我们获悉,一名互联网公司的前大模型核心人物已在与字节合作研发 AI 眼镜。
研究表明人类过度信任AI 加州大学默塞德分校的一项研究表明,人在面对生死抉择时,可能过于相信人工智能的建议。 该研究模拟了一场需要短时间内做决定的虚拟暗杀行动,给参与者查看一组照片,上面有着“友方”或“敌方”的标记,然后让他们迅速决定是否使用无人机打击目标,还是有着人工智能提供建议的那种。 实验结果令人意外,约三分之二的参与者都采用了人工智能的建议——即使这些建议是完全随机、毫无参考价值的! 尴尬的是,这些人事先就被告知过,AI系统并不可靠。 研究者霍尔布鲁克(Holbrook)认为,人类对于人工智能的依赖,不仅会影响到生活中买房等重大决策,还有可能会扩展到执法、医疗等诸多决策领域。
AI可能比人类更有创意 谈到人类和AI未来的取代关系,我们很常说的一句话是,AI不擅长创新创意,所以人类可以将更多精力放在这个部分,让AI做单调可重复性工作。 不过最新的斯坦福一个研究表明,大型语言模型(LLMs)除了在解决数学问题、协助证明、生成代码和发现大型数据集中的模式等各种任务中表现出了非凡的能力,还能够产生新颖的、专家级的研究思路,甚至在创意上超过人类,虽然可行性上还比较差。(论文:LLMs能产生新的研究想法吗?一项由 100 多名 NLP 研究人员参与的大规模人类研究)。 该团队具体的研究方法是,他们招募了 49 位 NLP 研究专家,就 7 个 NLP 主题撰写新颖的观点。同时,又建立了一个LLM代理,也生成关于同样 7 个主题的研究想法。之后,再招募了 79 位专家对所有人类和LLM创意进行盲审。结论就是,和常识相反,新颖性反而是人工智能生成的创意的主要优势,得分明显高于人类生成的创意(p < 0.05),但在可行性方面可能会遇到困难。 研究可能对人工智能在学术研究的作用产生影响,尤其是在构思过程中协助人类或与人类合作,因为利用AI产生想法的潜力可以加快各领域的研究效率。如果说人话就是,最好是用AI去创意,人类去验证,好像和我们之前的设想反过来了。
国产AI根本不缺算力 在英伟达显卡的销售版图中,美国占据了 40%的份额,而中国的占比可能达到 50%以上。值得注意的是,新加坡购买量为 20%,台湾地区为 18%,中国本土实际购买量为 12%。可以合理推测,新加坡和台湾地区有很大比例的购买量应是代买行为,毕竟新加坡和台湾地区没理由比日本、韩国、英国、法国、德国等国家的购买量高出几十倍。 在三大关键要素——算力、数据和人才方面,中国并不比美国逊色。甚至在应用场景和盈利模式上,中国可能比美国还要强出许多。然而,国内从事 AI 大模型开发的厂商数量众多,这导致算力无法高度集中来训练出最强大模型。或许需要一年时间来淘汰一批竞争者,从而使行业发展更加不健康从而产生真正的巨无霸。
希望能多出些近战机体啊 下次什么时候测试啊
设计师也好程序员也好,不要担心被完全取代 利用好 AI 这个工具,更好的出产能就好。 为什么不会被真正取代呢,因为我们所说的取代,其实是自然语言为输入的生成式人工智能,但语言有天然的局限性——无法精准的描述内心的想法。 你看到一张现实里的图,你都不能通过语言表述让 AI 给你生成一张一样的,80% 相似都难做到。 运用好新工具即可。
高盛发现ChatGPT月访问量断崖式下跌,这意味着什么? 这并不代表行业增长不会强劲,这并不代表行业增长不会强劲,下一波受益者可能来自,可以基于AI基础模型创建的新产品和服务。高盛报告称,科技行业基本面强劲,但集中度风险很高,建议寻求多元化投资,不错过其他行业由AI技术驱动的增长机会。详见http://t.cn/A6RTv39M
开源大模型新王干翻GPT4o 开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。 新模型名为Reflection 70B,使用一种全新训练技术,让AI学会在推理过程中纠正自己的错误和幻觉。 比如最近流行的数r测试中,一开始它犯了和大多数模型一样的错误,但主动在<反思>标签中纠正了自己。 在官方评测中,70B模型全面超越最强开源Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro,特别是数学基准GSM8K上直接刷爆,得分99.2%。 这个结果也让OpenAI科学家、德扑AI之父Noam Brown激情开麦:GSM8K得分99%!是不是可以正式淘汰这个基准了? 模型刚刚上线网友就把试玩挤爆了,对此Meta还主动支援了更多算力。 在网友测试中,Reflection 70B能回答对GSM8K数据集中本身答案错误的问题:我向模型提供了GSM8K中存在的5个“ground_truth”本身就不正确的问题。模型没有重复数据集中的错误答案,而是全部回答对了,这很令人印象深刻,表明那99.2%的准确率并非来自于记忆测试集! 数各种r都不在话下,连生造词“drirrrngrrrrrnnn”中有几个r也能被正确数对。 网友纷纷对小团队做出的开源超越顶流闭源感到惊讶,现在最强开源模型可以在本地运行了。 关键70B还只是个开始,官方表示下周还会发布更大的Reflection 405B,预计405B性能将大幅优于Sonnet和GPT-4o。 Reflection 70B权重已公开,API访问将于今天晚些时候由Hyperbolic Labs提供。
星火大模型更新了语音对话功能 讯飞星火大模型更新了语音对话,AI在说话的过程中可以随时打断,也就是她在说的同时可以听你的声音随时作出反应。 是的,几个月前 GPT4o 就可以了,但问题是星火它免费就可以用啊
利用生成式AI来改善玩家与NPC的互动 Jam & Tea Studios是一家新兴的游戏公司,利用生成式人工智能(AIGC)来改变玩家与非玩家角色(NPC)的互动方式。该公司由前Riot Games员工创立,其首款游戏《Retail Mage》将允许玩家与AI驱动的NPC进行自由对话,提供更多元化的游戏体验。此外,尽管生成式AI存在不确定性和潜在的创造性挑战,Jam & Tea仍致力于确保创意人员在游戏设计中的重要性,并展示这种技术在游戏开发中的潜力。
midreal 居然是国产的…
阿里发布开源多模态模型Qwen2-VL 阿里Qwen2大模型家族新添多模态模型Qwen2-VL,在图像和长视频理解任务上双双取得了SOTA。 在具体的子类任务中,Qwen2-VL在大部分的指标上都达到了最优,甚至超过 GPT-4o等闭源模型。 在多模态能力的加持下,Qwen2-VL可以实时读取摄像头或电脑屏幕,进行文字形式的视频对话。 甚至还能作为Agent与环境进行交互,根据任务目标自主操控手机等设备。 此次发布的Qwen2共有2B、7B、72B三个版本,其中2B和7B版本已可下载并免费商用(Apache 2.0),72B则通过API提供。 目前开源代码已集成到Hugging Face Transformers、vLLM等第三方框架中。 还有不少网友都在狂cue一些知名大模型推理平台,如Groq、Ollama,希望能够早日提供支持。 下面就来一睹Qwen2-VL的表现! 会操作机械臂的多模态大模型 利用强大的多模态能力,Qwen2-VL能够操纵机械臂,进行物体的拿取、放置等操作。 还可以化身扑克牌玩家,根据识别到的场上信息和提示词描述进行“24点”游戏的决策,并且取得了胜利。 还有开头所展示的,Qwen2-VL可以根据识别到的屏幕内容,结合用户需求自行操作手机在网络上进行信息检索。 当然在这些体现工具调用和Agent交互能力的复杂任务背后,基础能力也是不能落下。 比如图像识别,在物体类的识别当中,Qwen2-VL可以准确地认出花的品种。 另一类识别场景是文字,Qwen2-VL支持多种语言的文本提取。 甚至把16种语言混合到一张图中,Qwen2-VL不仅能判断各自的语种,也能一口气提取出全部文本。 手写字体和复杂的数学公式也能识别,并且上下标这种微小细节处理得非常到位。 Qwen2-VL还支持多模态推理,代码和数学(包括几何)类问题,只需要传张图片就能解决。 视频方面,Qwen2-VL最长可以对20分钟以上的视频进行内容分析,既支持总结也能对细节进行提问。 不过目前还只能分析画面,暂不支持对声音的处理。 同时也支持实时视频文字对话,除了开头展示的基于摄像头的对话外,也可以读取电脑屏幕,作为对话的内容。 总之,在这些任务的背后,蕴含着Qwen2-VL不凡的综合实力。 多模态实力超GPT-4o 为了了解Qwen2-VL在各种任务上的综合表现,千问团队一共从从六个方面对其视觉能力进行了评估。 具体包括了综合类大学试题、数学试题、文档表格理解、通用场景下的问答、视频理解以及Agent能力这六种类型。 整体来看,Qwen2-72B的大部分的指标上都达到了最优,甚至超过了GPT-4o和Claude3.5-Sonnet,特别是在文档理解方面优势明显。 另外在多语言测试中,MTVQA也在9种语言中的8种全面超越了GPT-4o、Claude3-Opus和Gemini Ultra这些先进闭源模型,平均成绩也是最高分。 7B版本同样支持图像、多图、视频的输入,同时也达到了同等规模模型的SOTA水准。 最小的2B版本则主要为移动端设计,但麻雀虽小,却具备完整图像视频多语言的理解能力,特别在视频文档和通用场景问答相较同规模模型优势明显。 整体上,Qwen2-VL延续了其上一代Qwen-VL中ViT加Qwen(2)的串联结构,在三个不同规模的模型上,Qwen2-VL都采用了600M规模大小的ViT,并且支持图像和视频统一输入。 为了让模型更清楚地感知视觉信息和理解视频,Qwen2-VL新增了对原生动态分辨率的全面支持。 与上一代模型相比,Qwen2-VL能够处理任意分辨率的图像输入,不同大小图片被转换为动态数量的tokens,最少只需要4个。 这种设计不仅确保了模型输入与图像原始信息之间的一致性,也模拟了人类视觉感知的自然方式,让模型在图像处理任务上更加灵活高效。 Qwen2-VL在架构上的另一项创新,是多模态旋转位置嵌入(M-ROPE)。 传统的旋转位置嵌入只能捕捉一维序列的位置信息,而M-ROPE通过将原始旋转嵌入分解为代表时间、高度和宽度的三个部分。 这使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息。 这一创新有助于提升模型的多模态处理和推理能力,能够更好地理解和建模复杂的多模态数据。
这吧怎么全是广告
目前国内的自动驾驶好像全部转向纯视觉的端到端模型了 效率确实快,转向速度迅速。但激光雷达真不如纯视觉方案吗?
知情人士称字节未决定建立大模型独立机构 今日有消息称,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。对此,知情人士对第一财经记者回应称:字节跳动有加强大模型相关研究的长期计划,但并未决定建立独立机构。另外,前零一万物技术联创黄文灏已加入字节跳动,负责技术项目管理和规划,汇报给字节跳动大模型负责人朱文佳。
大模型开源好还是闭源好 忻舟认为,大模型的开源和软件开源有本质区别——开源模型因其并未开放训练源代码、预训练和精调数据等影响模型效果的关键信息,所以无法像开源软件一样,靠社区开发者一起参与来提升效果和性能,而基座模型的训练只能掌握在厂商自己手里。
生成式AI并不具备真正的智能或个性 Anthropic最近公布了其最新AI模型Claude的“系统提示”,这是生成式AI的重要组成部分,旨在确保模型的行为符合预期。这些系统提示定义了Claude模型的基本特质和限制,并强调其个性化特征,以提高与用户的互动质量。这一透明度的做法不仅展示了Anthropic对伦理标准的重视,也可能促使竞争对手采纳类似的措施。 关键点 - 生成式AI并不具备真正的智能或个性,仅仅是依据统计概率预测下一句话的系统。 - 所有生成式AI供应商都会使用系统提示,以防止模型出现不当行为并引导回复的基调。 - 通常,供应商会将系统提示密封以防止潜在的规避措施,但Anthropic选择公开这些信息。 - 最新的系统提示明确列出了Claude模型无法执行的操作,如无法打开链接或识别面孔。 - 系统提示还描述了Claude应具备的个性特征和特点,比如聪明、具好奇心并乐于讨论各种话题。 - 对于争议性话题,Claude被要求保持客观和公正,并提供清晰的信息和谨慎的思考。 - Anthropic计划定期更新和披露其系统提示,进一步推动AI行业的透明度。
【竞选拉票】给自己拉个票,投票的朋友优先给小吧主 是标题党,但也说话算话。希望大家一起建设好这个贴吧,建设成全网最优秀的人工智能内容社区。 我一直不觉得这一波 AI 浪潮只是开发者的红利,这一波带来的其实是智力上的平权(相对于互联网是信息的平权)。自然语言的交互方式让所有普通人都可以以一个非常低的门槛来参与到其中。 而找遍全网,其实很难找到有一个很好的交流平台,目前更多的是点对多的 up主与粉丝的交流,个人不是很喜欢这种非对等的平台。而像阿里的魔搭社区更偏向技术,不适合普通人参与讨论,贴吧已经是能找到的平台里最棒的了。 关于管理经验,我也是 17 年的贴吧老吧友了,也曾是虎扑最早的采访团成员,在管理社区上还是有一定经验的,也希望大家能给我一个机会,给我投票一下,谢谢大家啦。我相信咱们吧还是有很多活跃的朋友的,只是目前的环境下并没有发声。 让我们一起把这里建设成最棒的 AI 交流社区吧
百度的资本支出最为节制,上半年为42亿元人民币,同比增长4% 尽管美国实施制裁以限制中国在人工智能领域的进展,中国科技巨头仍在加大对人工智能基础设施的投资,今年的资本支出同比增长至500亿元人民币(约70亿美元)。阿里巴巴、腾讯和百度等公司在购买处理器和基础设施方面投入重金,以支持自身及他人的大型语言模型训练。同时,字节跳动的AI相关支出也有所增加,其拥有超过500亿美元的现金储备,加上对中国AI初创企业的投资,推动了其云业务的快速增长。 关键要点 - 中国科技巨头在2023年上半年资本支出达500亿元人民币,比去年增加超过一倍。 - 阿里巴巴在这一波投资中专注于购买处理器和云计算基础设施,增加了123%的资本支出。 - 字节跳动作为最大的中国AI购买者,正在大量采购处理器并建立云计算基础设施。 - 腾讯的资本支出增长至230亿元人民币,增长率为176%,主要用于购买GPU和CPU服务器。 - 尽管面临美国的出口限制,中国科技公司仍能购买性能较低的Nvidia处理器,以满足需求。 - 阿里巴巴的AI相关产品收入年增长超过一倍,推动了其云业务的加速发展。 - 百度的资本支出最为节制,上半年为42亿元人民币,同比增长4%。 这也难怪百度这么拉垮了
AGI至少需要10年才可能实现,也可能永远无法实现 “AGI至少需要10年才可能实现,也可能永远无法实现” 这是全球知名的IT咨询公司Gartner最新报告给出的结论。 他们还强调:“AGI甚至可能都不值得追求。” 为啥这么说,咱们一起来聊一聊。 他们认为AGI目前正处于新兴技术炒作周期的“高度期望的峰值”阶段。 尽管人们对AGI的期望很高,但实际的技术成熟度和应用能力仍然有限。 “AGI的概念虽然吸引眼球,但实现它的路径并不清晰。” 就比如OpenAI这些搞大语言模型的,宣称自己摸到类人智能的门道。但一些专家认为AGI这概念还没整明白,LLM的方法也不靠谱。 他们还从2000多种技术中提炼出“关键见解”,列出了一套简洁的“必知”新兴技术,在《2024年新兴技术炒作周期》报告表示这些技术会在2-10年内会有大作为,但生成式AI即将进入“幻灭低谷期”。 对此,Gartner的分析师阿伦·钱德拉塞卡强调,大家对生成式AI的期望太高了,结果发现实际效果没那么好。不过长远来看,这个技术还是会对投资产生很大的影响。 AI专家马库斯还专门发表了篇文章,提醒人们生成式AI可能要爆雷,投资者们得悠着点了。 值得一提的是,Gartner之前也出过一项研究报告,说办公室AI想赚钱至少得等两年。截至到今年3月,微软还在努力说服客户,让他们相信使用AI真的可以提高生产力 而这次Gartner的《新兴技术炒作周期》中也提到了AGI。 对此,钱德拉塞卡说:“AGI不是第一次被炒热了,很多研究实验室都想搞它,但这事真心不容易。他们还不确定现在的方法对不对。” 他还说,研究界对于AGI是不是值得追求,意见也不统一。甚至到底什么时候能实现,实现出来是个什么样,都没个准信。 可能至少需要10年才可能实现,也可能永远无法实现。
MidjourneyAI图像生成网站现在向所有用户开放免费试用 Midjourney的AI图像生成网站现在向所有用户开放,并提供免费试用,让用户在不再依赖Discord的情况下,自由生成图像。新平台不仅简化了图像创建过程,还提供可视化编辑功能,使用户可以轻松修改和组织图像。尽管提供了25张免费图像的试用,但超过此限额后,用户将需选择付费计划。
未来是智能硬件的时代 今年AI领域有一个很大的亮点,就是大模型可以帮助很多硬件设备变得更智能,所以下半年肯定会出现很多有趣的硬件产品。不过,除了新产品之外,其实AI最大的优势,在于重新激活那些已经具备市场影响力的产品,让它们焕发出第二春。
Meta开发了一种人工智能辅助根因分析系统 Meta开发了一种人工智能辅助根因分析系统,通过结合启发式检索和大型语言模型(LLM)排序技术,提高系统故障调查的效率。在对系统进行的实测中,该工具在网站单体代码库相关调查初期具备42%的准确性。该系统使用Llama模型,将数以千计的代码更改缩小到几十个,再进一步缩小至五个潜在根本原因。此外,通过细致的训练和监督微调,模型在处理有限调查信息时表现更加出色。 关键点 - Meta使用AI辅助根因分析系统,提升系统故障调查效率。 - 系统结合启发式检索和大型语言模型排序技术实现根因识别。 - 在网站单体代码库相关调查初期的根因识别中准确率达到42%。 - Llama模型减少代码更改的搜索范围,识别最可能的五个根本原因。 - 模型通过历史调查数据进行继续预训练和监督微调。 - 细调数据集包括数千个指令调整例子和已知调查根因信息。 - AI系统帮助减少调查时间,并提升对于有限信息情况下的处理能力。
谷歌的不作恶信条早就废了 至少200名DeepMind员工对谷歌与军事组织的合同表达不满,指出这与企业的AI道德原则相悖。信件显示谷歌内部存有文化冲突,因为谷歌此前承诺不将DeepMind的技术用于军事和监控目的。这场抗议引发了对科技巨头在道德上的进一步质疑。 关键点 - DeepMind的员工反对谷歌与以色列军事的AI和云计算合同。 - 员工认为这些合同违背了谷歌的AI道德和责任声明。 - 谷歌收购DeepMind时承诺其技术不会用于军事用途。 - 此举显示出谷歌与DeepMind之间的文化冲突。 - 新的抗议行动导致对谷歌道德标准的质疑。 - 信件强调参与武器制造与谷歌的使命宣言相悖。 - 员工在2024年5月内部传播了抗议信件。
AI 销售行业的进展 AI销售开发代表(AI SDR)初创企业正在蓬勃发展,尽管风险投资家对其投资持谨慎态度。这些初创企业利用大型语言模型(LLMs)和语音技术自动化销售流程,实现个性化的客户沟通,并加速初创企业的成长。然而,尽管这些公司增长迅速,投资者仍担心它们是否能够长期保持这种增长,并面临现有企业的竞争威胁,这些企业可能将AI SDR功能作为免费附加服务。 关键点 - AI SDR使用大型语言模型和语音技术自动生成销售邮件和通话。 - 多个AI SDR初创企业在短时间内获得了显著增长。 - 投资者对这些初创公司的长期增长前景持观望态度。 - 许多小企业正在积极采用AI SDR工具以提高邮件回复率。 - AI SDR公司需要独特的客户数据才能提供更有效的个性化服务。 - 现有企业如Salesforce或ZoomInfo可能整合AI SDR功能,成为更强大的竞争对手。 - 投资者担心AI SDR增长的可持续性,因为这些公司可能被市场淘汰。
Scale AI 创始人 Alex Wang 的一个专访 最近看了 Scale AI 创始人 Alex Wang 的一个专访,很受启发。简单来说观点如下: - GPT-4 是 2022 年年底发布的,在那以后英伟达数据中心的营收从 50 亿美元增长到了 200 亿美元/季度,但 GPT-5 或远超 GPT-4 的模型,至今没有出现。 - 模型三板斧;算力、算法、数据。整个行业只是大幅增强了算力,小幅增强了算法,但对于数据,几乎没有进步。 - GPT-4 是一个基本上用尽了整个互联网所有公开易获取的文本数据的模型,基本用尽了。但如果要进一步增强模型的推理能力,需要给模型训练提供具备复杂推理过程的数据集——而这样的数据集还不存在。 比如一个银行的反诈分析师在分析一个可疑交易的时候需要对比不同时空的不同数据,结合经验综合多步骤推理和判断来得出结论,而这整个过程公开互联网上是没有的。 今天所有推动经济的推理和思考都没有放在互联网上,我们需要这样的数据来赋予模型强大可靠的推理能力。 - 有两种方法可以让模型超越人类,第一是通过某种算法建立通用的推理能力,这是 AI 领域的圣杯;第二是给出每一个细分场景下足够高质量的数据来训练模型,让高质量数据「淹没」模型,就能拿到一个推理能力很好的模型。 - 大模型是一个巨头的游戏,所有创业公司都应该认识到这一点。 具体到我更熟悉的智驾领域,有这么几个现状: - 智驾的端到端模型,无论是算力、算法、数据,都还没抵达 GPT-4 的阶段,大户人家如特斯拉也没有。这是端到端仍在高速迭代的基础。OpenAI 从 GPT-3 到 GPT-4 用了两年多,我们正处在智驾 GPT-3 到 4 的过程中。 - 仅通过摄像头(有些方案还有激光雷达、毫米波雷达)提供的数据,不断改进算法和算力,是否足以支持模型最终实现自动驾驶?大概率不足以。智驾模型最终需要理解现实世界的物理规律、对不同字体/字迹的文本信息、复杂的图像语义信息都有深刻的理解。 这意味着智驾大模型的数据集是多模态的、大规模的,同时某些复杂驾驶决策可能也需要像 Alex Wang 说的,在数据集中展示出人类驾驶员的分步骤推理过程,否则单凭看视频片段,模型可能很难抽象出所有复杂的驾驶决策逻辑。 - 纯粹的端到端模型,只通过学习人类的驾驶风格,大概率无法实现自动驾驶,因为模型没有推理能力——这是 VLM、世界模型这些概念的出发点。 如何训练世界模型这个级别的智驾模型,可以说目前业界没有企业建立起这样的工程能力,大家都在探索。特斯拉一定会和 xAI 合作。 - 大模型是一个巨头的游戏,所有创业公司都应该认识到这一点。智驾领域也是。
Claude’s 3.5 Sonnet 编程能力是目前最强的吗
人工智能吧吧主竞选:NO.0001号候选人
德米斯-哈萨比斯认为现在的AI "不合理的高效 " 前CEO施密特在斯坦福的一番吐槽,比如谷歌员工比较懒,所以给了OpenAI机会。不过施密特毕竟是前CEO,谷歌自己的AI团队是怎么想自己AI的呢?就要听现带头人讲了。 这只视频就是谷歌 DeepMind 联合创始人兼CEO德米斯-哈萨比斯(Demis Hassabis)与汉娜-弗莱教授的播客访谈,由于两位都是学者,所以有些问题谈得很深入。 德米斯-哈萨比斯认为现在的AI "不合理的高效 ",也就是从系统原理的角度,道理上不应该大模型能涌现出现在的效果,但实际上它做到了(辛顿之前做讲座的时候也说,没想到只要在工程上把规模最大就可以让AI更聪明了,其实不需要什么更多奇思妙想,是很让人惊讶的)。当然在访谈中,德米斯也解释了其中的道理。当主持人问谷歌的AI和OpenAI的有什么不同。他讲,ChatGPT擅长推理、Claude编码很强,而谷歌DeepMind的Gemini优势则是多模态。但是比较有趣的是,谷歌Deepmind觉得自己强的一个优势,却在AI助手发布上,被OpenAI抢了一天的风头。
地平线公司进军具身智能 自动驾驶计算方案公司地平线已组建了一个约 50 人的具身智能团队,负责人为地平线副总裁、前软件平台产品线总裁余轶南。此前我们提到,地平线 7 月初重组了智能驾驶算法团队,将投入更多精力研发高阶智驾。此次调整中,原低阶、中阶团队负责人余轶南,不再负责智驾业务,被调去带领这个新团队。
Karp持有强烈的美国偏见,他仍对人工智能的潜在滥用保持警惕 在《纽约时报》的一次罕见深入采访中,Palantir科技公司首席执行官Alex Karp探讨了战争、人工智能和美国的未来。Karp是一位与众不同的企业家,他的公司在美国国防中发挥着重要作用,尤其是在讨论自动化战争和隐私伦理的问题上。作为坚定的西方拥护者,他强调美国及盟友的技术优势,并对人工智能的潜在滥用保持警惕,但认为人工智能本身是解决这些滥用问题的唯一途径。 关键点 - Alex Karp 认为战争的本质正在发生变化,技术在其中扮演着关键角色。- 虽然Karp持有强烈的美国偏见,他仍对人工智能的潜在滥用保持警惕,主张使用人工智能来解决相关问题。- Palantir在支持美国及其盟友的安全上扮演着重要角色,但也因其道德复杂性而受到批评。- Karp的立场是美国必须在技术上保持主导地位以防被其他国家压制。- 作为支持副总统Kamala Harris的民主党人,Karp对民主党内部动态及政治正确性提出批评。- Palantir不与中国、俄罗斯等国做生意,坚持与西方盟国合作。- Karp 强调技术在战争中的重要性,并认为美国的道德体制使其在某些方面处于竞争劣势。
你们看了施密特的 AI 演讲吗,怎么看
【李飞飞的创业公司估值已经超过10亿美元了】 根据多家媒体报道,由斯坦福大学著名 AI 教授李飞飞创办的公司 World Labs 在两个月之内完成了两轮融资。据悉,最新一轮融资由 NEA 领投,对 World Labs 估值超过 10 亿美元。据《金融时报》7 月的报道,这轮融资金额为 1 亿美元。
人形机器人
苹果进军家用机器人 苹果公司正进军家用机器人领域,研发一个配有“类似iPad”显示屏的机器人手臂,团队由数百名员工组成。这一项目起始于约两年前,并在最近大幅加快进展。尽管制造自动驾驶电动车困难重重,但家用机器人领域的尝试失败率更高,不过苹果希望通过这一创新产品取得突破。 关键点 苹果正在研发家用机器人,包括一个配有显示屏的机器人手臂。 该产品灵感来源于亚马逊的Echo Show和Meta的Portal设备。 团队规模为数百人,项目进行约两年,近期加速研发。 家用机器人市场困难重重,鲜有成功案例。 苹果公司在电动车领域遇挫,转而投入家用机器人研发。 iRobot的Roomba是家用机器人领域少有的成功案例。 这一项目与苹果的传统产品不同,借鉴了智能家用设备的设计理念。
剪映也支持文生视频了 新版的剪映支持文生图,文生视频,图生视频等功能,在比如给音乐配画面、做动态写真视频、添加空镜等场景
Meta 计划于明年推出的带有 HUD(平视显示器)的智能眼镜 据 theinformation 报道,Meta 计划于明年推出的带有 HUD(平视显示器)的智能眼镜,其投影系统会使眼镜重量增加至约70克。 Meta 下一代增加了抬显,Myvu 下一代增加了摄像头,最终大家全都是殊途同归。 智能眼镜的最终形态也正如前段时间所说,耳机+第一视角摄影+HUD。最终就看谁能把佩戴体验做到更好了,是考验产品经理的能力——在工业设计上的权衡和妥协了。
1
下一页