LogoThread Easy
  • Explorar
  • Componer hilo
LogoThread Easy

Tu compañero integral para hilos de Twitter

© 2026 Thread Easy All Rights Reserved.

Explorar

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

中文没有空格,分词就是个大问题。

中文一词多义,"意思"和"意思"可能是完全不同的意思。

中文语序灵活,"我打了他"和"他被我打了",主语都不一样。

所以,中文太复杂,机器搞不定。

我以前也这么想。

直到我理解了 Word2Vec 是怎么工作的。

它根本不在乎语言的语法规则。

它只看一件事:这个词周围都是谁。

"苹果"周围经常是"水果""香蕉""新鲜"。

"蘋果"周围也是。

"apple"周围也是。

对 Word2Vec 来说,这三个词是一回事。

因为它们的用法一样。

中文有一词多义?没关系。

"苹果"(水果)周围是"吃""甜""新鲜"。

"苹果"(公司)周围是"手机""电脑""发布会"。

Word2Vec 会给它们不同的向量。

因为它们的上下文不一样。

中文分词难?也没关系。

Word2Vec 可以直接在字符级别上训练。

不需要分词,直接看字和字之间的关系。

甚至有研究发现,字符级别的中文词向量,效果不比分词后的差。

因为对机器来说,语言不是规则,是统计。

它不需要懂语法,它只需要看够多的数据。

看多了,它自己就知道:

哪些字经常一起出现,哪些词意思相近,哪些句子表达相似的意思。

英文也好,中文也好,对 Word2Vec 来说,都是一样的:

一堆符号,和这些符号之间的统计关系。

所以,中文 AI 不如英文?

不是语言的问题。

是数据的问题。

英文数据多,所以英文模型好。

中文数据少,所以中文模型差。

但这不是中文的错。

Word2Vec 证明了:

任何语言,只要有足够的数据,机器都能学会。

语言的复杂性,对人是障碍。

对机器,只是统计模式的区别。

---
另一个AI生成版本。

中文没有空格,分词就是个大问题。 中文一词多义,"意思"和"意思"可能是完全不同的意思。 中文语序灵活,"我打了他"和"他被我打了",主语都不一样。 所以,中文太复杂,机器搞不定。 我以前也这么想。 直到我理解了 Word2Vec 是怎么工作的。 它根本不在乎语言的语法规则。 它只看一件事:这个词周围都是谁。 "苹果"周围经常是"水果""香蕉""新鲜"。 "蘋果"周围也是。 "apple"周围也是。 对 Word2Vec 来说,这三个词是一回事。 因为它们的用法一样。 中文有一词多义?没关系。 "苹果"(水果)周围是"吃""甜""新鲜"。 "苹果"(公司)周围是"手机""电脑""发布会"。 Word2Vec 会给它们不同的向量。 因为它们的上下文不一样。 中文分词难?也没关系。 Word2Vec 可以直接在字符级别上训练。 不需要分词,直接看字和字之间的关系。 甚至有研究发现,字符级别的中文词向量,效果不比分词后的差。 因为对机器来说,语言不是规则,是统计。 它不需要懂语法,它只需要看够多的数据。 看多了,它自己就知道: 哪些字经常一起出现,哪些词意思相近,哪些句子表达相似的意思。 英文也好,中文也好,对 Word2Vec 来说,都是一样的: 一堆符号,和这些符号之间的统计关系。 所以,中文 AI 不如英文? 不是语言的问题。 是数据的问题。 英文数据多,所以英文模型好。 中文数据少,所以中文模型差。 但这不是中文的错。 Word2Vec 证明了: 任何语言,只要有足够的数据,机器都能学会。 语言的复杂性,对人是障碍。 对机器,只是统计模式的区别。 --- 另一个AI生成版本。

喜欢摇滚乐、爱钓鱼的PM 网站:https://t.co/vnUpLt752o

avatar for 向阳乔木
向阳乔木
Tue Nov 25 05:47:42
面试官问我:能用一句话解释 Word2Vec 吗?

我当时脑子里全是"Skip-gram""CBOW""负采样"...

但我知道,这些词说出来,面试就结束了。

后来,我想明白了。

Word2Vec 就是给词做定位。

就像给城市做定位。

北京和上海,都是大城市,所以它们在"城市规模"这个维度上很接近。

北京和天津,地理位置近,所以它们在"地理位置"这个维度上很接近。

Word2Vec 做的事情是一样的。

它给每个词找一个位置。

意思相近的词,位置就近。

怎么找这个位置?

看它周围都是谁。

"苹果"周围经常是"水果""香蕉""新鲜"。

"手机"周围经常是"电脑""屏幕""充电"。

所以机器知道,"苹果"应该和"香蕉"靠近,和"手机"远离。

这就是 Word2Vec。

不是教机器词典,是让机器看大量文本,自己学会每个词应该在哪里。

学完之后,你就可以算任意两个词有多像。

甚至可以做加减法:

King - Man + Woman = Queen

因为"性别"这个维度,在这个空间里是可以被分离出来的。

这是 2013 年的突破。

从那之后,机器才真的能"理解"语义。

所有现在的 NLP,都建立在这个基础上。

面试官听完,点了点头。

我过了。

--- 

由 AI 生成,科普 word2vec 论文核心概念。

面试官问我:能用一句话解释 Word2Vec 吗? 我当时脑子里全是"Skip-gram""CBOW""负采样"... 但我知道,这些词说出来,面试就结束了。 后来,我想明白了。 Word2Vec 就是给词做定位。 就像给城市做定位。 北京和上海,都是大城市,所以它们在"城市规模"这个维度上很接近。 北京和天津,地理位置近,所以它们在"地理位置"这个维度上很接近。 Word2Vec 做的事情是一样的。 它给每个词找一个位置。 意思相近的词,位置就近。 怎么找这个位置? 看它周围都是谁。 "苹果"周围经常是"水果""香蕉""新鲜"。 "手机"周围经常是"电脑""屏幕""充电"。 所以机器知道,"苹果"应该和"香蕉"靠近,和"手机"远离。 这就是 Word2Vec。 不是教机器词典,是让机器看大量文本,自己学会每个词应该在哪里。 学完之后,你就可以算任意两个词有多像。 甚至可以做加减法: King - Man + Woman = Queen 因为"性别"这个维度,在这个空间里是可以被分离出来的。 这是 2013 年的突破。 从那之后,机器才真的能"理解"语义。 所有现在的 NLP,都建立在这个基础上。 面试官听完,点了点头。 我过了。 --- 由 AI 生成,科普 word2vec 论文核心概念。

喜欢摇滚乐、爱钓鱼的PM 网站:https://t.co/vnUpLt752o

avatar for 向阳乔木
向阳乔木
Tue Nov 25 05:45:38
将文章变成黑板报的提示词(中文版)

--- 提示词 ---

请根据输入内容提取核心主题与要点,生成一张黑板报风格的信息图: 
- 采用黑色黑板背景和粉笔手绘风格,横版(16:9)构图。 
- 信息精简,突出关键词与核心概念,多留白,易于一眼抓住重点。 
- 加入少量简洁的卡通元素、图标或名人画像,增强趣味性和视觉记忆。 
- 所有图像、文字必须使用彩色粉笔绘制,没有写实风格图画元素 
- 除非特别要求,否则语言与输入内容语言一致。 
请根据输入的内容使用 nano banana pro 画图:

将文章变成黑板报的提示词(中文版) --- 提示词 --- 请根据输入内容提取核心主题与要点,生成一张黑板报风格的信息图: - 采用黑色黑板背景和粉笔手绘风格,横版(16:9)构图。 - 信息精简,突出关键词与核心概念,多留白,易于一眼抓住重点。 - 加入少量简洁的卡通元素、图标或名人画像,增强趣味性和视觉记忆。 - 所有图像、文字必须使用彩色粉笔绘制,没有写实风格图画元素 - 除非特别要求,否则语言与输入内容语言一致。 请根据输入的内容使用 nano banana pro 画图:

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

avatar for 宝玉
宝玉
Tue Nov 25 05:42:16
RT @cdxker: Replit literally is all of these combined 

It's not even a terminal anymore. It's actually an agentic development environment.

RT @cdxker: Replit literally is all of these combined It's not even a terminal anymore. It's actually an agentic development environment.

ceo @replit. civilizationist

avatar for Amjad Masad
Amjad Masad
Tue Nov 25 05:39:14
🍌 nano banana pro prompt

--- Prompt ---

Please create an infographic based on the input content, highlighting key themes and essential points:

- Simplify information, emphasizing keywords and core concepts, leaving ample whitespace for clarity.

- Include minimalistic cartoon elements, icons, or simple portraits of famous figures to enhance engagement and visual recall.

- All text and images should strictly use colored chalk style without realistic illustrations.

- Unless specifically requested, maintain the original language of the input content.

- Use a horizontal layout (16:9) with a black chalkboard background and colorful chalk drawing style.

Use "nano banana pro" for drawing based on the provided content.

🍌 nano banana pro prompt --- Prompt --- Please create an infographic based on the input content, highlighting key themes and essential points: - Simplify information, emphasizing keywords and core concepts, leaving ample whitespace for clarity. - Include minimalistic cartoon elements, icons, or simple portraits of famous figures to enhance engagement and visual recall. - All text and images should strictly use colored chalk style without realistic illustrations. - Unless specifically requested, maintain the original language of the input content. - Use a horizontal layout (16:9) with a black chalkboard background and colorful chalk drawing style. Use "nano banana pro" for drawing based on the provided content.

将文章变成黑板报的提示词(中文版) --- 提示词 --- 请根据输入内容提取核心主题与要点,生成一张黑板报风格的信息图: - 采用黑色黑板背景和粉笔手绘风格,横版(16:9)构图。 - 信息精简,突出关键词与核心概念,多留白,易于一眼抓住重点。 - 加入少量简洁的卡通元素、图标或名人画像,增强趣味性和视觉记忆。 - 所有图像、文字必须使用彩色粉笔绘制,没有写实风格图画元素 - 除非特别要求,否则语言与输入内容语言一致。 请根据输入的内容使用 nano banana pro 画图:

avatar for 宝玉
宝玉
Tue Nov 25 05:37:21
RT @Ersatz_Solus: @teortaxesTex Reminds me, in an overlanding thread where two people drove across the Congo in 2010 they mentioned that th…

RT @Ersatz_Solus: @teortaxesTex Reminds me, in an overlanding thread where two people drove across the Congo in 2010 they mentioned that th…

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Tue Nov 25 05:35:29
  • Previous
  • 1
  • More pages
  • 2434
  • 2435
  • 2436
  • More pages
  • 5635
  • Next