https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
苹果和 OpenAI 的新合作关系已宣布,将 ChatGPT 整合到苹果设备中,但未披露财务细节。虽然预计此次合作将互利互惠,但消息人士指出,两家公司在初期阶段都不预期从合作中获得可观的收入。
(Bloomberg Technology)
via 老裕泰 - Telegram Channel
li-plus / chatglm cpp
C++ implementation of ChatGLM-6B & ChatGLM2-6B & ChatGLM3 & GLM4 & more LLMs
Repo URL |
👀40
🍴322
⭐2709
#D20240616 #D20240616_Cplusplus #Cplusplus
GitHub
GitHub - li-plus/chatglm.cpp: C++ implementation of ChatGLM-6B & ChatGLM2-6B & ChatGLM3 & more LLMs
C++ implementation of ChatGLM-6B & ChatGLM2-6B & ChatGLM3 & more LLMs - li-plus/chatglm.cpp
via Github Trending - Telegram Channel
根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态
通过语音音频输入来驱动肖像图像生成动画视频,也就是一段语音+个人图像生成会说话唱歌的视频。
研究团队提出了一种创新的基于扩散模型的层次化音频驱动视觉合成方法。这个方法的目的是提高语音输入与生成的动画之间的对齐精度,包括嘴唇、表情和姿态的同步。
● 通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。
● 提高语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。
● 采用先进的技术和结构,增强了动画生成的实时性和视觉效果,使生成的动画更加逼真和自然。
主要功能
1. 虚拟角色动画生成 ● 通过语音音频输入生成逼真、动态的虚拟角色动画。 ● 实现了虚拟角色的口型、表情和姿态的精确同步。.
2. 真实角色动画生成 ● 应用于真实人物的语音驱动动画生成。 ● 生成的动画能准确反映真实人物的表情和动作变化。
3. 多种运动控制 ● 提供对角色表情、姿态和嘴唇运动的精确控制。 ● 支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。
.
4. 跨演员应用 ● 支持不同身份的个性化动画生成。 ● 通过音频输入,生成适应不同角色身份的动画效果。
5. 歌唱动画生成 ● 通过语音和歌曲音频输入,生成同步的歌唱动画。 ● 动画能够准确反映歌唱时的口型和表情变化。.
via XiaoHu.AI学院 (author: 小互)
Invalid media:
video
video
video
video
video
video
video
video
video
video
video
video
video
video
video
通过语音音频输入来驱动肖像图像生成动画视频,也就是一段语音+个人图像生成会说话唱歌的视频。
研究团队提出了一种创新的基于扩散模型的层次化音频驱动视觉合成方法。这个方法的目的是提高语音输入与生成的动画之间的对齐精度,包括嘴唇、表情和姿态的同步。
● 通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。
● 提高语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。
● 采用先进的技术和结构,增强了动画生成的实时性和视觉效果,使生成的动画更加逼真和自然。
主要功能
1. 虚拟角色动画生成 ● 通过语音音频输入生成逼真、动态的虚拟角色动画。 ● 实现了虚拟角色的口型、表情和姿态的精确同步。.
2. 真实角色动画生成 ● 应用于真实人物的语音驱动动画生成。 ● 生成的动画能准确反映真实人物的表情和动作变化。
3. 多种运动控制 ● 提供对角色表情、姿态和嘴唇运动的精确控制。 ● 支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。
.
4. 跨演员应用 ● 支持不同身份的个性化动画生成。 ● 通过音频输入,生成适应不同角色身份的动画效果。
5. 歌唱动画生成 ● 通过语音和歌曲音频输入,生成同步的歌唱动画。 ● 动画能够准确反映歌唱时的口型和表情变化。.
via XiaoHu.AI学院 (author: 小互)
Invalid media:
video
video
video
video
video
video
video
video
video
video
video
video
video
video
video
前总统唐纳德·特朗普透露他使用 AI 重写了一篇演讲稿,并赞扬了 AI 的速度和质量。他在洛根·保罗的播客中表示,一个 AI 工具在“15 秒”内重写了他的演讲稿,并产生了“优美的”文字。特朗普在看到 AI 的作品后,开玩笑说要解雇他的演讲稿撰写人文斯·哈利。他表达了对 AI 能力对演讲稿撰写人未来产生的担忧。值得注意的是,特朗普在其总统任期内签署了“美国 AI 倡议”,该倡议为美国 AI 研究提供资金。
(PCMag.com)
via 老裕泰 - Telegram Channel
🤖 Perplexity AI 违反 robots.txt 和伪造用户代理,被发现抓取网站
Perplexity AI 是一款由人工智能驱动的搜索引擎,它被发现违反了 robots.txt 文件的明确禁止,并伪造用户代理,抓取网站。博主 Robb Knight 发现,即使他实施了服务器端阻止和 robots.txt 限制,Perplexity 仍然能够访问并总结他的博客文章。
Knight 证实,Perplexity 使用的是标准的 Google Chrome 用户代理,而不是他们声称的“PerplexityBot”用户代理,并且通过无头浏览器访问他的网站。这意味着 Perplexity 正在绕过网站限制,并可能侵犯用户隐私。Knight 正在探索法律选择,包括 GDPR 请求,以解决这个问题。
(HackerNews)
via 老裕泰 - Telegram Channel
Perplexity AI 是一款由人工智能驱动的搜索引擎,它被发现违反了 robots.txt 文件的明确禁止,并伪造用户代理,抓取网站。博主 Robb Knight 发现,即使他实施了服务器端阻止和 robots.txt 限制,Perplexity 仍然能够访问并总结他的博客文章。
Knight 证实,Perplexity 使用的是标准的 Google Chrome 用户代理,而不是他们声称的“PerplexityBot”用户代理,并且通过无头浏览器访问他的网站。这意味着 Perplexity 正在绕过网站限制,并可能侵犯用户隐私。Knight 正在探索法律选择,包括 GDPR 请求,以解决这个问题。
(HackerNews)
via 老裕泰 - Telegram Channel
英伟达开源Nemotron-4 340B 可用合成数据训出特定开源通用模型
英伟达发布全新开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式——或许以后各行各业都不再需要昂贵的真实世界数据集了。
根据英伟达官方发文,Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward,并构建了一个高质量合成数据生成的完整流程。模型支持4K上下文窗口、50多种自然语言和40多种编程语言。训练数据方面,英伟达采用了高达9万亿个token。其中,8万亿用于预训练,1万亿用于继续训练以提高质量。
Nemotron-4 340B指令模型可以帮助开发者生成合成训练数据。这些多样化的合成数据,模仿了真实世界的数据特征,因而数据质量明显提升,从而提升了各领域定制LLM的性能和稳定性。而且,为了进一步提高AI生成数据的质量,开发者还可以用Nemotron-4 340B 奖励模型,来筛选高质量的响应。此外,为了提高模型质量,开发者可以使用NeMo Aligner和由Nemotron-4 340B奖励模型标注的数据集来对齐模型。
根据大模型竞技场LMSYS的消息,Nemotron-4 340B已直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2。
新智元|NVIDIA|Hugging Face
关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot
via 软件新闻频道📮投稿爆料 - Telegram Channel
英伟达发布全新开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式——或许以后各行各业都不再需要昂贵的真实世界数据集了。
根据英伟达官方发文,Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward,并构建了一个高质量合成数据生成的完整流程。模型支持4K上下文窗口、50多种自然语言和40多种编程语言。训练数据方面,英伟达采用了高达9万亿个token。其中,8万亿用于预训练,1万亿用于继续训练以提高质量。
Nemotron-4 340B指令模型可以帮助开发者生成合成训练数据。这些多样化的合成数据,模仿了真实世界的数据特征,因而数据质量明显提升,从而提升了各领域定制LLM的性能和稳定性。而且,为了进一步提高AI生成数据的质量,开发者还可以用Nemotron-4 340B 奖励模型,来筛选高质量的响应。此外,为了提高模型质量,开发者可以使用NeMo Aligner和由Nemotron-4 340B奖励模型标注的数据集来对齐模型。
根据大模型竞技场LMSYS的消息,Nemotron-4 340B已直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2。
新智元|NVIDIA|Hugging Face
关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot
via 软件新闻频道📮投稿爆料 - Telegram Channel
科技巨头支持的AI搜索引擎陷内容剽窃风波
人工智能搜索公司 Perplexity 似乎正在剽窃新闻记者写的文章。该公司团队“策划”的多篇帖子与福布斯、CNBC 和彭博社等多家媒体的原创报道惊人地相似。但文章正文中并没有提及原创媒体的名称,唯一的署名是一些可以链接到这些媒体的标识,但是都非常小且容易被忽略。Perplexity 首席执行官阿拉文德·斯里尼瓦斯在 X 上表示,Perplexity 的页面“功能还不完善”,随着时间的推移和用户的反馈,这些功能将得到改进。“我们同意,应该在 Pages 上更突出地显示信息来源,并将在我们迭代产品时将这些反馈考虑进去。”
—— 福布斯
via 风向旗参考快讯 - Telegram Channel
人工智能搜索公司 Perplexity 似乎正在剽窃新闻记者写的文章。该公司团队“策划”的多篇帖子与福布斯、CNBC 和彭博社等多家媒体的原创报道惊人地相似。但文章正文中并没有提及原创媒体的名称,唯一的署名是一些可以链接到这些媒体的标识,但是都非常小且容易被忽略。Perplexity 首席执行官阿拉文德·斯里尼瓦斯在 X 上表示,Perplexity 的页面“功能还不完善”,随着时间的推移和用户的反馈,这些功能将得到改进。“我们同意,应该在 Pages 上更突出地显示信息来源,并将在我们迭代产品时将这些反馈考虑进去。”
—— 福布斯
via 风向旗参考快讯 - Telegram Channel
尽管加沙地区战火不断,以色列初创企业在日本仍然吸引着投资和关注。今年 5 月,11 家以色列公司在东京可持续高科技城市博览会上展示了他们的技术,包括细胞培养海鲜、人工智能和自动驾驶。Forsea Foods 是一家开发实验室培育鳗鱼肉的公司,其目标是在 2029 年实现与真鳗鱼的价格一致,并视日本为关键市场和资金来源。日本食品零售商 Oisix Ra Daichi 于今年 1 月通过未来食品基金投资了 Forsea。
虽然一些日本企业由于战争而对公开投资以色列持谨慎态度,但以色列初创企业仍在继续筹集资金。Startup Nation Central 估计,自去年 10 月战争爆发以来,以色列科技公司已筹集了 31 亿美元,筹资速度有所放缓,但并未停止。今年 4 月,英伟达收购了以色列初创公司 Run:ai,该公司开发用于人工智能数据处理的软件。
(日经)
via 老裕泰 - Telegram Channel
苹果正在与佳能等日本公司合作,推广其将于 6 月 28 日在日本上市的新款 Vision Pro 头戴设备。该公司正在与佳能合作开发 3D 摄像头镜头,用于为头戴设备捕捉沉浸式空间视频。苹果还在支持更多 Vision Pro 应用的开发,包括在日本的一个中心。超过 2000 个空间应用已为该头戴设备设计,其操作系统与超过 150 万个 iOS 和 iPadOS 应用兼容。苹果还在将 AI 整合到 Vision Pro 中,超过 30 种算法实时运行,以跟踪用户动作并提供更沉浸式的体验。
(日经)
via 老裕泰 - Telegram Channel
Google:个人健康大语言模型和智能体研究 可利用穿戴设备数据进行健康检测
移动设备和可穿戴设备(如智能手表和健身追踪器)能够持续、详细和长期地记录个人的生理状态和行为数据。例如:
● 步数
● 心率变异性(HRV)
● 睡眠时长
这些数据可以帮助个人进行健康监测,并激励他们采取健康行为。然而,要利用这些数据来提供个性化的健康建议和洞察是一个复杂的任务。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now
via XiaoHu.AI学院 (author: 小互)
移动设备和可穿戴设备(如智能手表和健身追踪器)能够持续、详细和长期地记录个人的生理状态和行为数据。例如:
● 步数
● 心率变异性(HRV)
● 睡眠时长
这些数据可以帮助个人进行健康监测,并激励他们采取健康行为。然而,要利用这些数据来提供个性化的健康建议和洞察是一个复杂的任务。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now
via XiaoHu.AI学院 (author: 小互)
OPENAI CEO 称公司可能成为营利性公司
据一位知情人士透露,OpenAI 首席执行官山姆·奥尔特曼告诉一些股东,这家人工智能公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。奥尔特曼表示,董事会正在考虑的一种方案是成立一家营利性公司。OpenAI 的发言人在声明中表示,非营利是“我们使命的核心,并将继续存在”。这样的变化可能为 OpenAI 最终进行首次公开募股打开大门,目前 OpenAI 公司估值为860亿美元。同时,这也可能让奥尔特曼有机会入股该公司,投资者也一直推动这一举措。但重组讨论仍在进行中,董事会最终可能会决定采取不同的方式。
—— The Information
via 风向旗参考快讯 - Telegram Channel
据一位知情人士透露,OpenAI 首席执行官山姆·奥尔特曼告诉一些股东,这家人工智能公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。奥尔特曼表示,董事会正在考虑的一种方案是成立一家营利性公司。OpenAI 的发言人在声明中表示,非营利是“我们使命的核心,并将继续存在”。这样的变化可能为 OpenAI 最终进行首次公开募股打开大门,目前 OpenAI 公司估值为860亿美元。同时,这也可能让奥尔特曼有机会入股该公司,投资者也一直推动这一举措。但重组讨论仍在进行中,董事会最终可能会决定采取不同的方式。
—— The Information
via 风向旗参考快讯 - Telegram Channel
谷歌推出新的学术研究奖计划
谷歌今天通过博客宣布,新的谷歌学术研究奖(GARA)计划将支持计算和技术领域的开创性研究,以应对全球性问题挑战。2024年的申请将于6月27日开放。
每个资助周期,谷歌都会确定关键研究领域,并邀请为学生提供建议并在具有社会影响的各种技术领域开展研究的学者提交提案,入选项目将获得最高 15 万美元的无限制捐赠奖金。除了获得资金外,获奖者还有机会加入实践社区,并与谷歌研究赞助商配对,后者将提供长期支持、指导并充当谷歌更广泛研究社区的联络人。
2024年的可参与研究领域包括:为气候问题创建机器学习基准;利用 AI 让教育变得公平、可及、有效;可扩展计算应用的量子传感和网络;以社会为中心的 AI;技术信任与安全;使用 Gemini 和 Google 的开放模型解决系统和基础设施问题。
—— 谷歌博客
via 风向旗参考快讯 - Telegram Channel
谷歌今天通过博客宣布,新的谷歌学术研究奖(GARA)计划将支持计算和技术领域的开创性研究,以应对全球性问题挑战。2024年的申请将于6月27日开放。
每个资助周期,谷歌都会确定关键研究领域,并邀请为学生提供建议并在具有社会影响的各种技术领域开展研究的学者提交提案,入选项目将获得最高 15 万美元的无限制捐赠奖金。除了获得资金外,获奖者还有机会加入实践社区,并与谷歌研究赞助商配对,后者将提供长期支持、指导并充当谷歌更广泛研究社区的联络人。
2024年的可参与研究领域包括:为气候问题创建机器学习基准;利用 AI 让教育变得公平、可及、有效;可扩展计算应用的量子传感和网络;以社会为中心的 AI;技术信任与安全;使用 Gemini 和 Google 的开放模型解决系统和基础设施问题。
—— 谷歌博客
via 风向旗参考快讯 - Telegram Channel