https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
AudioNotes:音视频内容转笔记系统 快速提取音视频的内容并转成Markdown笔记

AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频内容转结构化笔记系统。它的主要功能是快速提取音视频的内容,并通过调用大模型进行整理,将这些内容转换为结构化的Markdown笔记,便于用户快速阅读和理解。

● 音视频内容识别:利用先进的自动语音识别(ASR)技术,能够精准地提取音视频中的文本内容。
● 结构化笔记生成:通过大模型对提取的内容进行整理,生成清晰、易读的Markdown笔记。
● 与音视频内容对话:支持用户与音视频内容进行交互式对话,以获取更多信息或进行深入探讨。

AudioNotes 主要功能包括:

1. 音视频内容识别与提取利用 FunASR 自动语音识别技术,准确提取音频和视频中的文本内容。 支持多种音视频格式的处理,确保广泛的适用性。
2. 结构化笔记生成通过 Qwen2 大模型对提取的文本内容进行整理。 自动生成结构化的Markdown笔记,便于用户快速阅读和理解。 笔记内容条理清晰,包含关键信息和要点,减少用户手动整理的时间。
3. 与音视频内容对话提供与音视频内容进行交互式对话的功能。 用户可以就音视频内容提问,系统会基于识别和整理的文本内容进行回答,提供深度信息获取的能力。

via XiaoHu.AI学院 (author: 小互)
WayveScenes101 是一个用于自动驾驶应用的高分辨率图像数据集,主要用于新视角合成(novel view synthesis)和场景重建研究。

它由 Wayve Technologies Ltd 发布,包含101个不同驾驶场景的高分辨率图像和相机位置信息,每个场景持续20秒。这些场景涵盖了多种不同的地点、交通状况和环境条件,如不同的天气、路况和时间段,是研究自动驾驶技术的宝贵资源。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now

via XiaoHu.AI学院 (author: 小互)
日本新闻协会发称 AI 搜索可能侵犯著作权

2024-07-22 14:10 by 伊甸

日本新闻协会发表声明称,美国 IT 巨头 Google、微软等公司提供的将网络搜索引擎与生成式 AI 相结合的“搜索联动型生成式 AI 服务”(即 AI 搜索引擎)很可能构成侵犯著作权。声明指出,此类服务经常擅自利用新闻报道作为信息源、生成类似新闻报道的回答。它要求美国 IT 巨头获得新闻媒体的使用许可。声明分析称,有一些案例显示,搜索联动型 AI 对新闻报道进行不恰当的转用和加工,生成了存在错误内容的回答。声明强调,应当在确保准确性和可靠性之后再开始提供服务。

https://china.kyodonews.net/news/2024/07/07b3691766b8-ai.html

#人工智能

via Solidot - Telegram Channel
六成受访者在使用AI时感到信息泄露风险

日本信息处理推进机构近日汇总了在业务中使用人工智能的安全性相关调查报告。在回答工作中使用人工智能等的1000人中,六成人表示感到了信息泄露和虚假信息扩散等威胁与风险。关于输入人工智能的营业秘密泄露、滥用人工智能导致虚假信息扩散等各个项目,调查分别询问了如何看待。把获得的答复平均后发现,认为“是重大威胁”的占27.1%,“略有威胁”占33.3%,合计为60.4%。认为“不太是威胁”的占6.2%,“完全不是威胁”的占2.4%,合计为8.6%,远低于前者。另一方面,关于迅速普及的生成式人工智能的使用情况,回答称组织内已制定和明文化规则的不到20%。上述机构指出:“明文化滞后、以及由使用者自行处理的组织较多。特别是在中小规模的组织中,应对迟缓。”

—— 共同社

via 风向旗参考快讯 - Telegram Channel
🆔 网站名称:海艺AI

⭐️ 网站功能:AI绘画

📁 网站简介:一个免费AI艺术生成器平台,可以通过文本输入创造AI艺术作品。

提供多种快捷AI工具,如草稿成图、AI写真、AI图像增强器、一键扩图等。

🌐 网站网址:点击打开
📢 频道 ✈️ 群聊 📬 投稿 💵 商务

via AI绘画|AI视频 - Telegram Channel
Live_Portrait_Monitor :利用摄像头驱动静态图像转换为实时动态视频

Live_Portrait_Monitor 基于快手的这个 LivePortrait 项目,实现了摄像头驱动图像转换为实时动态视频,生成逼真的肖像动画效果。

这个项目旨在让静态肖像通过摄像头变得栩栩如生。通过预训练模型和脚本,用户可以将静态图像转换为动态视频。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now

via XiaoHu.AI学院 (author: 小互)
E5-V:多模态大语言模型的通用嵌入 统一不同模态的“嵌入表示”

多模态大语言模型(MLLMs)已经在理解图像和文本方面取得了很大的进展,但在如何表示和整合这两种类型的信息方面还存在不足。

E5-V是一个新框架,通过只使用文本对进行训练,成功地解决了图像和文本这两种输入在表示上的差异问题,从而实现了通用的多模态嵌入。这意味着E5-V能够在同一个语义空间中同时处理和表示图像和文本信息,使得多模态信息的表示更加统一和高效。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now

via XiaoHu.AI学院 (author: 小互)
给iPhone背面贴AI录音机火了 全网销售额超 1000 万美元 火遍海外的iPhoneAI外设是深圳制造

一款名为Plaud Note(简称Plaud)的AI卡片录音机在国外众筹平台Indiegogo上销售额超过600万美元,由一家中国深圳的创业公司制造。

Plaud定义为全球首款由ChatGPT支持的录音机,卡片形状设计,可磁吸在iPhone背后,与MagSafe兼容。Plaud电池容量为400mAh,满电状态下可连续录音30小时,存储约480小时音频。它不需要安装新App或获取授权,录音时可通过内置应用进行同传,并且录音内容可以通过搭载的GPT-4o模型整理成脑图、笔记或日记等,支持近60种语言。

新浪科技

☘️ 关注频道 @ZaiHuaPd
📮 投稿爆料 @ZaiHuabot

via 软件新闻频道📮投稿爆料 - Telegram Channel
Nvidia 正在为中国市场准备新的旗舰 AI 芯片特供版本

三位知情人士称,Nvidia 正在开发一款面向中国市场的新型旗舰 AI 芯片,该芯片将符合与美国目前的出口管制要求。在该公司将于今年晚些时候量产的 “Blackwell” 芯片系列中,旗舰芯片 B200 在某些任务上的速度比其前代产品快 30 倍。两位消息人士称,Nvidia 将与其在中国的主要分销合作伙伴之一浪潮集团合作,推出和分销这款暂定名为“B20”的芯片。此前,Nvidia 开发了三款专门针对中国市场的芯片。

—— 路透社

via 风向旗参考快讯 - Telegram Channel
英伟达正在为中国市场开发其新款旗舰人工智能芯片的版本,该版本将符合现行的美国出口管制规定。英伟达将与中国经销商合作伙伴浪潮合作推出“B20”芯片。 - 路透社
$NVDA

(@CN Wire)

via 老裕泰 - Telegram Channel
🤖 英伟达为中国市场调整旗舰 AI 芯片

英伟达正在为中国市场开发其即将推出的“Blackwell” B200 AI 芯片的修改版本,以遵守美国出口限制。这款芯片暂定名为“B20”,在聊天机器人响应等任务中将比其前代产品快 30 倍。英伟达将与中国主要分销商浪潮合作,负责该芯片的发布和分销。此举是在美国于 2023 年收紧对中国先进半导体的出口管制之后做出的。英伟达已经专门为中国市场开发了三款芯片,以应对这些限制。

(路透社)

via 老裕泰 - Telegram Channel
Mem0:为大语言模型提供永久记忆能力 实现跨应用程序的个性化AI体验

Mem0为大语言模型提供了一层智能的、自我改进的记忆层,用于大语言模型(LLM),以实现跨应用程序的个性化AI体验。也就是为大语言模型(比如ChatGPT)提供了一个个性化记忆存储功能,使其能够记住和利用之前的交互信息,从而提供更加个性化的服务。

解决了AI模型缺乏长期记忆和个性化能力的问题,使AI能够根据用户历史和偏好提供更精确和有用的响应。

Mem0适用于需要长期记忆和上下文保留的AI应用,如聊天机器人和智能助理。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

Subscribe
Gain access to all our Premium contents.
More than 100+ articles.
Subscribe Now

via XiaoHu.AI学院 (author: 小互)
DeepL推出新一代语言模型,号称翻译质量超越GPT-4

翻译技术公司DeepL日前宣布推出新一代大型语言模型(LLM),显著提升了其翻译服务质量。根据最新盲测结果,DeepL的新模型在翻译质量方面优于谷歌翻译、ChatGPT-4和微软翻译。与经典模型相比,新模型在日语、简体中文和德语与英语互译方面的质量提升了1.4到1.7倍。DeepL强调,新模型不仅翻译更加自然流畅,还减少了误译情况,可为企业节省大量编辑时间和成本。

DeepL

Via 凌卡

☘️ 关注频道 @ZaiHuaPd
📮 投稿爆料 @ZaiHuabot

via 软件新闻频道📮投稿爆料 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]