ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

21:09 · 2024年9月12日 · 周四

Runway ：关于未来AI生成式媒体工具界面和交互的设计原则

Runway 发布了一篇文章介绍了他们对 AI 生成媒体的新交互方式的思考。Runway认为应该为生成式媒体创建全新界面，超越目前主要依赖的文本提示方式。

Runway称AI 不仅仅是一种工具，而是一种新的创作媒介，因此需要开发全新的交互方式。他们介绍了三种用于未来生成媒体世界的界面原型，展现了该领域的广阔可能性和挑战。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)

20:50 · 2024年9月12日 · 周四

📉 中国科技巨头在打击行动后挣扎

经过两年对阿里巴巴、腾讯和滴滴全球等主要科技公司的政府打击，中国自2023年以来放宽了限制。尽管政策有所转变，这些公司在适应新的监管环境时仍面临增长缓慢的问题，新规更强调人工智能和半导体，而非传统的电子商务和游戏行业。随着打击行动的结束，监管机构于2022年恢复了视频游戏许可证，并在2023年初解除了对滴滴应用程序的禁令。然而，阿里巴巴和腾讯的市场价值仍显著低于打击前水平——分别从峰值损失了6000亿美元和5000亿美元。

中国政府继续优先考虑社会稳定而非快速扩张科技行业，保持严格监督以防止过去如垄断行为等过度现象。这包括鼓励与国家优先事项一致的举措，同时不鼓励科技领袖积累财富。因此，许多知名人物已退出公众角色或调整其商业策略，以符合北京“共同富裕”的目标。

尽管从2022年的低谷中有所回升，但分析人士认为，由于持续的监管限制旨在确保数据安全并减少因疫情期间互联网繁荣而加剧的社会差距，要重返之前高点可能性不大。

(Bloomberg Technology)

via 老裕泰 - Telegram Channel

20:50 · 2024年9月12日 · 周四

🎮 微软在游戏部门裁员650人，行业缩减中

微软正在其视频游戏部门裁员约650名员工，这是去年以750亿美元收购动视暴雪后的一项削减成本策略。根据微软游戏首席执行官菲尔·斯宾塞的说法，此次裁员主要影响公司和支持岗位，旨在为业务的长期成功做好准备，而不会关闭任何工作室或取消项目。这一举措反映了更广泛的行业趋势，今年仅在游戏领域就已削减超过11,500个职位。

这家科技巨头做出这一决定之际，也正值其对人工智能进行重大投资，并在最近几个月内进行了总计190亿美元的大规模资本支出。今年早些时候，微软还从Xbox部门裁掉了大约1,900名员工，并关闭了三个工作室。尽管有这些削减措施，但微软的Game Pass服务仍然持续增长，今年早些时候报告称拥有3,400万订阅用户。一项关键测试将是与零售同步推出动视下一个《使命召唤》游戏到Game Pass上——这一战略转变可能会影响这个顶级游戏系列的收入动态。

(华尔街日报)

via 老裕泰 - Telegram Channel

20:50 · 2024年9月12日 · 周四

🍓 OpenAI的“草莓”AI模型即将发布，具备增强的推理能力

OpenAI即将推出一款新的AI模型，内部代号为“草莓”，该模型承诺具备类似于人类解决问题的高级推理能力。尽管确切时间尚不确定，但这次发布可能会在本周早些时候向部分用户开放。这一发展标志着人工智能技术的一大飞跃，使得该模型能够处理复杂的多步骤问题，如复杂的数学和编程任务。

“草莓”的推出正值与Anthropic和谷歌等竞争对手激烈竞争之际，这些公司也在提升其模型的推理技能。与其前身ChatGPT不同，“草莓”将采用一种“思维链”提示技术，使其在回应之前稍作停顿——通过考虑多个相关提示来提高准确性。

今年早些时候，在演示中，OpenAI展示了该模型解决具有挑战性的文字题目以及一个此前难倒其他系统的高级化学问题的能力。这一进展符合OpenAI自2023年5月以来，通过逐步解决问题训练方法来改进人工智能的不懈努力。

作为其公众参与战略的一部分，OpenAI计划在下个月旧金山举行的TED AI等即将到来的活动中进一步讨论生成式人工智能。

(Bloomberg Technology)

via 老裕泰 - Telegram Channel

20:50 · 2024年9月12日 · 周四

🛡️ 万事达卡以26.5亿美元收购网络防御公司

万事达卡公司宣布已同意以26.5亿美元收购网络防御公司Recorded Future，旨在增强其全球支付网络对抗网络威胁和欺诈的安全性。此次从Insight Partners的收购将加强万事达卡在网络安全工作中使用人工智能的能力。Recorded Future在2019年被Insight Partners获得控股权时估值超过7.8亿美元，目前为75个国家的1900多家客户提供服务。这一举措正值全球网络犯罪成本预计今年将达到9.2万亿美元之际。万事达卡首席服务官Craig Vosburg强调，这一合作关系将加速创新，并更好地预见支付系统及其他领域的新兴威胁。交易预计将在明年初完成。

(Bloomberg Technology)

via 老裕泰 - Telegram Channel

20:49 · 2024年9月12日 · 周四

📱 全球反垄断审查对大型科技巨头的关注加剧

包括谷歌、苹果、Meta、亚马逊和X（前身为推特）在内的全球领先科技公司，正面临来自美国司法部（DOJ）和欧盟监管机构日益严格的反垄断审查。司法部正在对谷歌提起重大案件，指控其在价值6770亿美元的在线搜索市场和展示广告中形成垄断。华盛顿可能采取分拆谷歌业务的行动，这将是一个历史性的举措。

苹果也在美国受到抨击，被指控通过其iPhone和iPad上的硬件和软件实践限制竞争。这起诉讼是在对苹果市场行为进行五年调查后提出的。

在欧洲，新法规——《数字市场法案》（DMA）和《数字服务法案》（DSA）——正在对Alphabet Inc.、Meta Platforms Inc.、字节跳动有限公司、微软公司等主要科技公司实施更严格的控制。这些法律旨在遏制反竞争行为，对于重复违规者，根据DMA规则可处以高达全球销售额20%的罚款。

此外，欧盟DSA要求社交媒体平台更有效地处理非法内容，否则将面临相当于其年度收入6%的处罚。最近的一些调查针对Facebook、Instagram、TikTok、X以及AliExpress的不合规问题展开。

监管机构还关注大型科技公司在人工智能领域的投资，例如微软向OpenAI投资130亿美元，以防止这些企业主导这一新兴行业。大西洋两岸都密切关注这些发展，因为他们希望在全球数字市场中平衡创新与公平竞争。

(Bloomberg Technology)

via 老裕泰 - Telegram Channel

20:48 · 2024年9月12日 · 周四

🔍 爱尔兰监管机构调查谷歌的AI数据实践

爱尔兰数据保护委员会（DPC）已对Alphabet公司旗下的谷歌展开调查，以评估其在开发Pathways语言模型2（PaLM 2）过程中是否遵守欧盟隐私法。此次调查重点关注谷歌是否根据《通用数据保护条例》（GDPR）进行了强制性的数据保护影响评估，这是在处理个人数据时保障个人权利的重要措施。在全球对大型科技公司使用个人数据进行人工智能开发的审查日益严格之际，欧盟实施了严厉法规以控制此类活动。由于这些公司的欧盟总部设在爱尔兰，因此由爱尔兰DPC负责监督，包括谷歌等公司。最近，在面临来自DPC的类似监管压力后，埃隆·马斯克的X Corp同意停止使用欧洲用户的数据来训练其AI聊天机器人Grok。此外，由于收到DPC关于用户帖子用于模型训练请求，Meta平台推迟了其AI聊天机器人在欧洲的推出。

(Bloomberg Technology)

via 老裕泰 - Telegram Channel

17:40 · 2024年9月12日 · 周四

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

via XiaoHu.AI学院 (author: 小互)

Telegraph

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

Jina AI 推出的两款专门将原始 HTML 转换为干净的 Markdown 的小型语言模型。 Reader-LM 的功能特点 HTML 到 Markdown 转换：HTML 到 Markdown 的转换： Reader-LM 专为将原始 HTML 内容转换为干净、结构化的 Markdown 文件而设计，简化了从网页提取和清理数据的过程。无需复杂的规则或正则表达式，模型能自动处理噪声内容，如广告、脚本、导航栏等，生成结构清晰的 Markdown。

17:19 · 2024年9月12日 · 周四

Mistral AI 发布其首个多模模型 Pixtral 12B

2024-09-12 15:30 by 燃烧的银河

法国 AI 创业公司 Mistral AI 发布了其首个多模模型 Pixtral 12B，具有语言和视觉处理能力，它能识别图像但不能生成图像。用户可通过 Hugging Face 和 GitHub 访问其源代码，源码采用 Apache 2.0 许可，用户可以不受限制的下载、微调和使用。Pixtral 12B 有 120 亿参数，模型大小 24GB。它是基于文本模型 Nemo 12B，应该能执行为图像添加文字描述和计算照片中物体数量等任务。Mistral 没有披露使用了哪些图像去训练模型。

https://techcrunch.com/2024/09/11/mistral-releases-pixtral-its-first-multimodal-model/
https://huggingface.co/mistral-community/pixtral-12b-240910
https://github.com/mistralai/mistral-common/releases/tag/v1.4.0

#人工智能

via Solidot - Telegram Channel

17:05 · 2024年9月12日 · 周四

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B，该模型具有120 亿参数，可以处理图像和文本任务，适用于图像标注、物体计数等任务。与其他多模态模型（如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o）类似。

Pixtral 12B 基于 Mistral 的文本模型 Nemo 12B 开发，能够通过 URL 或 base64 编码的图像回答与图像相关的问题。理论上可以执行图像字幕生成、物体计数等任务。

● 图像标注：模型能够根据图片生成简洁而准确的描述。
● 物体计数：用户可以通过模型快速获得图像中物体的数量。
● 生成任务：适用于需要图像和文本结合的复杂 AI 任务，如视觉问答、图像生成等。

Pixtral 12B 可以通过 GitHub 和 Hugging Face 下载，支持在 Apache 2.0 许可下进行微调和使用。

Mistral 开发者关系负责人 Sophia Yang 表示，Pixtral 12B 将很快在 Mistral 的聊天机器人和 API 服务平台 Le Chat 和 Le Plateforme 上提供测试。

Mistral 并没有公布Pixtral 12B的更多信息。Mistral 邀请了一些人员参加了一个峰会会议，其中展示了 Pixtral 12B 的一些基准测试结果。

模型下载：

magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce

via XiaoHu.AI学院 (author: 小互)

16:19 · 2024年9月12日 · 周四

Google 推出将用户文档转化为音频播客的 AI 功能

Google 周三宣布，其人工智能笔记和研究应用 NotebookLM 将添加“音频概览”功能,为用户提供另一种方式来消化和理解他们上传到该应用的文档中的信息，例如课程阅读材料或法律摘要。此前该应用已经可以使用文字的方式帮助用户简化复杂内容。

AI 生成的两位虚拟主持人将使用对话式的语音模式为用户总结其分享的材料。主持人将分享来自源材料的事实或引人注目的话题，并使用隐喻来解释复杂的概念。谷歌表示，聆听这些讨论将帮助用户找到文档之间的新联系或为他们的草稿获得灵感。

—— TechCrunch

via 风向旗参考快讯 - Telegram Channel

16:17 · 2024年9月12日 · 周四

Adobe 将推出的文本转视频生成 AI 工具

Adobe 透露了即将推出的一些生成式 AI 视频工具，其中包括可以从静态图像中生成视频片段的新功能。该最新预览版以该软件巨头四月份展示的正在开发的 Firefly 视频模型为基础。新的宣传片展示了 Firefly 的文本转视频功能所制作的素材，Adobe 于今年早些时候宣布了该功能。该工具允许用户使用文本描述生成视频剪辑，并使用模拟摄像机角度、运动和拍摄距离的各种“摄像机控制”调整结果。还演示了 Firefly 视频模型的图像转视频功能，该功能可以使用特定的参考图像生成剪辑。文本转视频和图像转视频功能将在年底作为独立 Firefly 应用首次推出测试版。

—— TheVerge

via 风向旗参考快讯 - Telegram Channel

16:16 · 2024年9月12日 · 周四

美国即将批准向沙特出口英伟达芯片

知情人士称，美国政府正在考虑允许英伟达向沙特出口先进芯片。这将有助于该国训练和运行最强大的人工智能模型。今年早些时候，美国减少了英伟达先进显卡的出货量，因为担心沙特阿拉伯与中国的密切关系可能会让宝贵的人工智能机密流入那里，或可能为中国获取这些芯片打开大门。据了解沙特政策的人士透露，沙特政府已采取措施限制其与中国企业的合作，如果美国切断沙特与最先进芯片的供应，沙特政府仍向中国敞开大门。沙特政府预计将收到英伟达H200芯片，这是该公司目前最先进的芯片。

—— Semafor

via 风向旗参考快讯 - Telegram Channel

16:07 · 2024年9月12日 · 周四

Google NotebookLM推出 “Audio Overview” 的功能可以将任意文档转换成播客对话

Google 推出的 NotebookLM 新增了一项名为 “Audio Overview” 的功能，允许用户将上传的文档内容转换为音频对话。这一功能通过两位 AI 主持人进行“深入探讨”，将上传的文档总结为一段对话，帮助用户以听觉方式理解信息。用户可以下载生成的音频，方便随时随地收听。

主要功能特点：

1. AI 主持人讨论： ● 一旦用户上传了文档并点击生成按钮，两位 AI 主持人将启动一个类似对话的讨论，深入剖析文档中的主要内容。 ● 他们会总结内容，探讨文档中的主题，并尝试建立不同概念之间的联系，为用户提供一个对话式的学习体验。
2. 支持多种资料类型： ● NotebookLM 支持用户上传的各种资料来源，并能根据这些内容生成音频概述。用户可以用该工具来快速理解复杂的文档或研究报告。 ● 生成的内容并不是对文档的全面分析，而是基于用户提供的资料进行总结，所以不一定是绝对客观或全面的。
3. 随时下载音频概述： ● 用户可以生成并下载音频文件，将其随身携带，方便在上下班途中或其他闲暇时间收听，提升学习和信息处理的灵活性。
4. 与 NotebookLM 其他功能集成： ● 除了音频生成，NotebookLM 还能够快速创建学习指南、简报文档等，这些功能通过 Google 的 Gemini 1.5 多模态模型支持。 ● 这些功能有助于更好地组织和提取资料中的关键信息，简化复杂信息的处理。
5. 数据隐私和安全： ● Google 强调 NotebookLM 不会使用用户的个人资料来训练模型，确保用户数据的隐私和安全。
6. 实验阶段和已知限制： ● Audio Overview 功能目前还处于实验阶段，可能会有一些限制： ● 生成速度：对大型笔记生成音频可能需要几分钟。 ● 语言支持：目前只支持英文对话。 ● 不完全准确：有时主持人的解释可能不够准确，尤其是在内容复杂或具有专业性时。 ● 互动性有限：当前用户无法在对话生成过程中插入问题或打断主持人。

生成联邦公报播客

博士论文生成播客

如何使用 Audio Overview：

1. 打开 NotebookLM：访问 NotebookLM 并打开您已创建的笔记。
2. 点击生成按钮：在笔记中点击“生成”按钮，NotebookLM 将自动开始创建音频概述。
3. 下载音频：生成的音频可以被下载，方便在移动设备上播放。

实用场景：

● 复杂信息总结：对需要处理大量复杂信息的用户，Audio Overview 可以帮助快速抓住文档的要点。
● 学习工具：对那些更喜欢听觉学习的用户，这项功能能够提升学习效率。
● 随时随地获取信息：用户可以将生成的音频带在身边，在任何时候播放，充分利用碎片时间。

未来改进：

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)

Invalid media: video

14:19 · 2024年9月12日 · 周四

🆔 项目名称：auto-video-generateor

⭐️ 项目功能：解说视频生成

📁 项目简介：一款根据用户输入的主题，自动生成解说视频。

系统调用大语言模型生成故事或解说的文字，然后通过语音合成接口生成解说的语音，接着调用文生图接口生成与文字内容相匹配的图片，最终融合语音和图片生成解说视频。

🌐 项目地址：点击打开
📢 频道 ✈️ 群聊 📬 投稿 💵 商务

via AI绘画｜AI视频 | AI音乐 - Telegram Channel

Before

After