https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
🤖 Common Crawl被指为AI公司提供付费墙内容并引发争议
非营利组织Common Crawl(成立于2007年,已抓取数十亿网页)因其巨大的互联网存档库被OpenAI、Google、Anthropic、Nvidia、Meta和Amazon等AI公司用于训练大模型而引发争议。该组织被指控为AI公司提供高质量的付费墙文章,并谎称不绕过付费墙或应新闻出版商要求删除内容。Common Crawl执行董事Rich Skrenta回应称,其爬虫不会执行付费墙代码,因此能在付费墙生效前读取全文,并表示出版商若不希望内容被抓取就不应发布到网上。目前,Common Crawl的CCBot已成为流行网站屏蔽最广泛的抓取程序之一。
(科技情报)
via 茶馆 - Telegram Channel
非营利组织Common Crawl(成立于2007年,已抓取数十亿网页)因其巨大的互联网存档库被OpenAI、Google、Anthropic、Nvidia、Meta和Amazon等AI公司用于训练大模型而引发争议。该组织被指控为AI公司提供高质量的付费墙文章,并谎称不绕过付费墙或应新闻出版商要求删除内容。Common Crawl执行董事Rich Skrenta回应称,其爬虫不会执行付费墙代码,因此能在付费墙生效前读取全文,并表示出版商若不希望内容被抓取就不应发布到网上。目前,Common Crawl的CCBot已成为流行网站屏蔽最广泛的抓取程序之一。
(科技情报)
via 茶馆 - Telegram Channel
🧠 Comet是Perplexity推出的AI浏览器,主打智能助手和信息整合。相比传统浏览器,AI助手能帮你整理多标签内容、快速摘要网页,适合科技用户高效获取信息
🔍 虽然底层依然是Chromium,实际用起来甚至比Dia Browser更显笨重。默认用Perplexity搜索,支持自然语言提问,也能自定义快捷指令,但传统搜索体验和流畅度还有提升空间
⚡ 我手头还有3个Comet邀请码,欢迎有兴趣的大家来体验,也感谢 James 分享给我的邀请码:
🔸 https://perplexity.ai/browser/claim/G7V7YOIOU0
🔸 https://perplexity.ai/browser/claim/1M3F3IRH09
🔸 https://perplexity.ai/browser/claim/SSQSPGIL14
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
via Roller | AI AGENT 中文社区 - Telegram Channel
研究发现 AI 回复过于友好而很容易分辨
2025-11-09 20:54 by 夜焰
下次你在社交媒体上遇到非常有礼貌的回复,不妨仔细检查下。它可能是一次 AI 模型试图融入人类但失败的尝试。苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员在预印本平台 arXiv 上发表了一篇论文,指出在社交媒体的对话中 AI 模型和人类仍然很容易区分,原因是 AI 有一个非常明显特征:语气过于友好。研究人员在 Twitter/X、Bluesky 和R eddit 上测试了九个开放权重的大模型:Llama 3.1 8B、Llama 3.1 8B Instruct、Llama 3.1 70B、Mistral 7B v0.1、Mistral 7B Instruct v0.2、Qwen 2.5 7B Instruct、Gemma 3 4B Instruct、DeepSeek-R1-Distill-Llama-8B 和 Apertus-8B-2509,发现他们开发的分类器能以 70%-80% 的准确率识别出 AI 生成的回复。
https://arstechnica.com/information-technology/2025/11/being-too-nice-online-is-a-dead-giveaway-for-ai-bots-study-suggests/
https://arxiv.org/abs/2511.04195
#人工智能
via Solidot - Telegram Channel
2025-11-09 20:54 by 夜焰
下次你在社交媒体上遇到非常有礼貌的回复,不妨仔细检查下。它可能是一次 AI 模型试图融入人类但失败的尝试。苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员在预印本平台 arXiv 上发表了一篇论文,指出在社交媒体的对话中 AI 模型和人类仍然很容易区分,原因是 AI 有一个非常明显特征:语气过于友好。研究人员在 Twitter/X、Bluesky 和R eddit 上测试了九个开放权重的大模型:Llama 3.1 8B、Llama 3.1 8B Instruct、Llama 3.1 70B、Mistral 7B v0.1、Mistral 7B Instruct v0.2、Qwen 2.5 7B Instruct、Gemma 3 4B Instruct、DeepSeek-R1-Distill-Llama-8B 和 Apertus-8B-2509,发现他们开发的分类器能以 70%-80% 的准确率识别出 AI 生成的回复。
https://arstechnica.com/information-technology/2025/11/being-too-nice-online-is-a-dead-giveaway-for-ai-bots-study-suggests/
https://arxiv.org/abs/2511.04195
#人工智能
via Solidot - Telegram Channel
Common Crawl 被批为 AI 公司提供高质量付费墙文章
2025-11-09 20:16 by 开普勒62号3:旅行
成立于 2007 年的非盈利组织 Common Crawl 致力于存档互联网,它至今抓取了数以十亿计的网页。但最近几年它引发了争议,其巨大的存档库被 AI 公司如 OpenAI、Google、Anthropic、Nvidia、Meta 和 Amazon 用于训练大模型。Common Crawl 为 AI 公司打开了一扇后门,允许它们使用高质量付费墙文章训练模型,并在抓取付费墙文章上撒谎。Common Crawl 声称它不会绕过付费墙,会应新闻出版商要求删除其内容,但实际上并非如此。Common Crawl 执行董事 Rich Skrenta 对此回应称,新闻出版商如果不想它们的内容被抓取,就不应该将内容发布到网上。他说,Common Crawl 的爬虫不会登陆其抓取的网站,但一部分付费墙机制不会影响它的爬虫。比如很多网站在执行付费墙代码前会短暂允许浏览器访问全文,然后代码检查访客是不是付费用户,如果不是就隐藏内容。Common Crawl 的爬虫不会执行付费墙代码,因此能直接阅读全文。过去一年 Common Crawl 的 CCBot 如今已成为流行网站屏蔽最广泛的抓取程序。
https://tech.slashdot.org/story/25/11/08/1930213/common-crawl-criticized-for-quietly-funneling-paywalled-articles-to-ai-developers
#人工智能
via Solidot - Telegram Channel
2025-11-09 20:16 by 开普勒62号3:旅行
成立于 2007 年的非盈利组织 Common Crawl 致力于存档互联网,它至今抓取了数以十亿计的网页。但最近几年它引发了争议,其巨大的存档库被 AI 公司如 OpenAI、Google、Anthropic、Nvidia、Meta 和 Amazon 用于训练大模型。Common Crawl 为 AI 公司打开了一扇后门,允许它们使用高质量付费墙文章训练模型,并在抓取付费墙文章上撒谎。Common Crawl 声称它不会绕过付费墙,会应新闻出版商要求删除其内容,但实际上并非如此。Common Crawl 执行董事 Rich Skrenta 对此回应称,新闻出版商如果不想它们的内容被抓取,就不应该将内容发布到网上。他说,Common Crawl 的爬虫不会登陆其抓取的网站,但一部分付费墙机制不会影响它的爬虫。比如很多网站在执行付费墙代码前会短暂允许浏览器访问全文,然后代码检查访客是不是付费用户,如果不是就隐藏内容。Common Crawl 的爬虫不会执行付费墙代码,因此能直接阅读全文。过去一年 Common Crawl 的 CCBot 如今已成为流行网站屏蔽最广泛的抓取程序。
https://tech.slashdot.org/story/25/11/08/1930213/common-crawl-criticized-for-quietly-funneling-paywalled-articles-to-ai-developers
#人工智能
via Solidot - Telegram Channel