huangyihe
huangyihe
  • 41
  • 187 361
提升AI知识库效果,从PDF转Markdown开始
想要提升AI知识库的效果,一定要先对PDF之类的资料做处理。PDF转Markdown,推荐用Mathpix或者Marker。前者效果更好,但要付费。后者免费,依靠本地GPU。
⭐️ 视频中提到的产品 / 项目 👇
➡︎ Mathpix: mathpix.com/
➡︎ Marker: github.com/VikParuchuri/marker
⭐️ 更多相关视频 👇
➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html
➡︎ czcams.com/video/3GxhvbwHyKc/video.html
➡︎ czcams.com/video/g-KMmBWodOk/video.html
===========================
加入付费社群,提问 / 交流
===========================
🔥 Patreon:www.patreon.com/newtype_ai
🔥 知识星球:t.zsxq.com/19IaNz5wK
===========================
墙内用户来微信平台来找我
===========================
⚡️ 视频号:黄益贺
⚡️ 公众号:newtype 超级个体
===========================
我的理念 + 我想干什么
===========================
🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代最重要的杠杆,大过资本和人力。
🤖️ 通过分享关于AI的Why和How,通过内容和社群,聚集像我一样希望成为【超级个体】的人。
zhlédnutí: 1 648

Video

AI时代,如何学习?
zhlédnutí 1,5KPřed 16 hodinami
不要跟AI比拼知识的广度,而应该扎到基本原理层面,发挥自身抽象思考、跨领域联想、创造性思维的独特优势,再借助AI这个杠杆,去撬动更大的能量。 ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代最重要的杠杆,大过...
GraphRAG:很好,但很贵!
zhlédnutí 18KPřed 14 dny
微软最新开源的GraphRAG确实能补上传统RAG的短板,显著提升精确度。但是速度慢、成本高是当前最大问题。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ GraphRAG: microsoft.github.io/graphrag/posts/get_started/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级...
当浏览器与大模型打通:Brave浏览器 + Ollama
zhlédnutí 3,1KPřed 14 dny
Brave浏览器 Ollama,上网冲浪时也可以随时启动、调用本地大模型。目前这个功能还处在测试阶段,希望官方后续能提供更多自定义功能。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ Brave Nightly: brave.com/zh/download-nightly/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype ...
如何让ChatGPT做PPT
zhlédnutí 4,2KPřed 28 dny
让ChatGPT做PPT,只能输出文字,还需要我们手动排版。如果用Marp作为桥梁的话,只需要一个软件、一个操作,就能搞定AI生成PPT了。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ Marp: marp.app/ ➡︎ Slidev: sli.dev/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理...
如何让AI帮你快速看完一本书?
zhlédnutí 2,7KPřed měsícem
再次强烈推荐谷歌的AI神器:NotebookLM。最近不仅增添了对中文的支持,而且还推出笔记本指南功能,超级适合学习! ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ NotebookLM: notebooklm.google/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为...
围绕Obsidian,打造AI知识库
zhlédnutí 3,3KPřed měsícem
我对自己的AI知识库做了一次小升级,以Obsidian为核心。在Omnivore和Readwise两款插件的帮助下,把外部信息的处理环节转移到Obsidian上,算是比较满意的形态了。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ Omnivore: omnivore.app/ ➡︎ Readwise: readwise.io/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找...
ChatGPT的正确打开方式
zhlédnutí 2,6KPřed měsícem
用iOS快捷指令功能,搭建一套简易的Workflow,实现ChatGPT自动化运行。在新版iOS和新版Siri出来之前,这应该是最有效的使用方法了。 ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代最重要的杠...
学习Agent,从dify开始
zhlédnutí 4,3KPřed měsícem
Agent最核心的,不是技术,而是Workflow。用dify.ai来上手,很合适。dify把代码的逻辑,用流程的方式,在画板上呈现出来,一看就明白。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ dify: dify.ai/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 Patreon:www.patreon.com/newtype_ai 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为...
LLM = OS
zhlédnutí 3KPřed 2 měsíci
围绕大模型打造操作系统将成为业界新共识。除了OpenAI这类巨头,一些开发者也行动起来了。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ phidata: github.com/phidatahq/phidata ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代最重要的杠杆,大过资本...
最适合知识库的大模型
zhlédnutí 2,8KPřed 2 měsíci
知识库应用,如果要用云端大模型的话,我首选Command R 了。它针对RAG优化过,多语种支持包括中文。这几天用下来,感觉比GPT-4好。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ OpenRouter: openrouter.ai/ ➡︎ LM Studio: lmstudio.ai/ ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、...
如何搭建一套Agent系统
zhlédnutí 4,6KPřed 2 měsíci
给大家演示一个Agent案例,看看怎么从需求出发,搭建一套Agent系统。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ crewai-obsidian: github.com/business24ai/crewai-obsidian ⭐️ 更多相关视频 👇 ➡︎ czcams.com/video/LpWzvm_ZQ2U/video.html ➡︎ czcams.com/video/3GxhvbwHyKc/video.html ➡︎ czcams.com/video/g-KMmBWodOk/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代...
未来三年最值钱的工作
zhlédnutí 3,1KPřed 2 měsíci
随着AI Agent成为所有厂商追捧的对象,一个新职业出现:Agent设计师。他既要懂AI,又要懂业务,横跨AI世界和人类世界,非常稀有,非常值钱。 ⭐️ 视频中提到的产品 / 项目 👇 ➡︎ CrewAI: github.com/joaomdmoura/crewAI ⭐️ 更多相关视频 👇 ➡︎ AI不会替代你,但是...:czcams.com/video/3GxhvbwHyKc/video.html ➡︎ 我的AI笔记系统:czcams.com/video/g-KMmBWodOk/video.html ➡︎ 两款AI插件,让Obsidian更强大:czcams.com/video/W8YkZw7_gpA/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newt...
AI不会替代你,但是...
zhlédnutí 2,8KPřed 2 měsíci
AI不会替代你,但是用AI的人会。分享我个人学习AI的方法。我完全零经验、零背景,从去年五月开始,半年起飞。 ⭐️ 更多相关视频 👇 ➡︎ 我的AI笔记系统:czcams.com/video/g-KMmBWodOk/video.html ➡︎ 两款AI插件,让Obsidian更强大:czcams.com/video/W8YkZw7_gpA/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代人一生一遇级别的机会。2、内容和代码是这个时代最重要的杠杆,大过资本和人力。 🤖️ 通过分享关于AI的Why和How,通过内容和社群,聚集像我一样希望成为【超级个体】的人。
两款AI插件,让Obsidian更强大
zhlédnutí 7KPřed 3 měsíci
⭐️ 视频中提到的产品 / 项目 👇 ➡︎ Obsidian: obsidian.md/ ➡︎ Text Generator: github.com/nhaouari/obsidian-textgenerator-plugin ➡︎ Copilot: github.com/logancyang/obsidian-copilot ⭐️ 更多相关视频 👇 ➡︎ 我的笔记系统:czcams.com/video/g-KMmBWodOk/video.html ➡︎ 最适合普通人的知识库:czcams.com/video/9wip8PQ69hs/video.html 加入付费社群,提问 / 交流 🔥 知识星球:t.zsxq.com/19IaNz5wK 墙内用户来微信平台来找我 ⚡️ 视频号:黄益贺 ⚡️ 公众号:newtype 超级个体 我的理念 我想干什么 🤖️ 我坚定认为:1、AI是我们这代...
我的AI笔记系统
zhlédnutí 17KPřed 3 měsíci
我的AI笔记系统
问答引擎,本地部署
zhlédnutí 2,1KPřed 3 měsíci
问答引擎,本地部署
最适合普通人的知识库
zhlédnutí 4,5KPřed 3 měsíci
最适合普通人的知识库
本地跑大模型,需要什么配置
zhlédnutí 13KPřed 3 měsíci
本地跑大模型,需要什么配置
Ollama + Hugging Face:给Ollama添加任何大模型
zhlédnutí 5KPřed 3 měsíci
Ollama Hugging Face:给Ollama添加 何大模型
本地大模型,免安装!
zhlédnutí 1,9KPřed 4 měsíci
本地大模型,免安装!
本地知识库,外网也可以访问
zhlédnutí 2,7KPřed 4 měsíci
本地知识库,外网也可以访问
部署本地大模型和知识库,最简单的方法
zhlédnutí 33KPřed 4 měsíci
部署本地大模型和知识库,最简单的方法
NotebookLM:AI时代的笔记应用
zhlédnutí 4,3KPřed 4 měsíci
NotebookLM:AI时代的笔记应用
Elon Musk:Sam Altman是叛徒
zhlédnutí 316Před 4 měsíci
Elon Musk:Sam Altman是叛徒
让Agent自动搜集每日资讯
zhlédnutí 1,5KPřed 4 měsíci
让Agent自动搜集每日资讯
Sora:站在OpenAI的肩膀上
zhlédnutí 13KPřed 5 měsíci
Sora:站在OpenAI的肩膀上
套壳之王:Perplexity
zhlédnutí 16KPřed 5 měsíci
套壳之王:Perplexity
再见,GPTs
zhlédnutí 3,5KPřed 5 měsíci
再见,GPTs
AI需要影分身
zhlédnutí 922Před 5 měsíci
AI需要影分身

Komentáře

  • @waynechiu9078
    @waynechiu9078 Před 6 minutami

    MinerU瞭解一下

  • @origeniuslaw3288
    @origeniuslaw3288 Před 5 hodinami

    marker我用了很久了,挺不错的,那个在线不知道会不会效果好点?

    • @huanyihe777
      @huanyihe777 Před 3 hodinami

      我感觉Mathpix效果很不错,可以试试。免费转10页

  • @limjuroy7078
    @limjuroy7078 Před 12 hodinami

    可以说下Colpali吗?最近也很像很红。再来,我想把你的影片翻译成英文然后发给我的马来同事😂 我是大马华裔。

  • @benwong5667
    @benwong5667 Před 17 hodinami

    可以通过本地AI模型接入本地知识库,然后接入微信进而演变成 微信AI客服呢?

  • @user-xn5pw9cb3w
    @user-xn5pw9cb3w Před 17 hodinami

    666 is very 6

  • @user-kr2ki4fo4j
    @user-kr2ki4fo4j Před 19 hodinami

    现在最新的模型里面哪个对中文支持最好呢,llama3.1如何

    • @huanyihe777
      @huanyihe777 Před 17 hodinami

      Llama3.1不行。要开源、中文的话,用国产的吧

  • @qiuchenzhang3721
    @qiuchenzhang3721 Před 20 hodinami

    视频内容很好,但是标题太绝对了,很抱歉!属实有点标题党的样子了,例子举的是huggingface中的模型,但是huggingface上的模型并不全有gguf格式的,虽然有工具可以转化为gguf格式的,但是据我所知也不全支持所有大模型架构的。如果视频中能够介绍当没有gguf格式的,该如何转换,那么视频的标题和内容就很完美

  • @huanyihe777
    @huanyihe777 Před dnem

    CZcams会员:czcams.com/channels/PpdGTNbIKdiWgxCrbka4Zw.htmljoin Patreon:www.patreon.com/newtype_ai 知识星球:t.zsxq.com/19IaNz5wK

  • @bittergourd
    @bittergourd Před dnem

    可否区分一下建立索引和单次检索的开销(时间,金钱)?谢谢。11美元如果是建立graph和rag的开销,之后单次检索能控制在cent数量级也不是不能忍。

    • @huanyihe777
      @huanyihe777 Před dnem

      10美元建立索引。关于低成本使用方法,我昨晚发了视频,在CZcams会员频道

  • @user-lr5lw5wv9i
    @user-lr5lw5wv9i Před dnem

    你好想請教一下 想我已經gpt 產出的一串代碼粘貼到 vs code但他旁邊沒有預覽的畫面 清問是哪個地方出錯了嗎

  • @jingdongli2573
    @jingdongli2573 Před 3 dny

    这浏览器可以和lm联通嘛?

  • @jy03189211
    @jy03189211 Před 4 dny

    491 次 api 调用以后生成知识图谱,那之后的问答应该不是一次十几美元吧?生成完图谱之后就没有这么高的成本了了吧?

    • @holsetyhuang2435
      @holsetyhuang2435 Před 2 dny

      确实,所以可以生成图谱然后卖图谱?

    • @huanyihe777
      @huanyihe777 Před dnem

      10美元建立索引。关于低成本使用方法,我昨晚发了视频,在CZcams会员频道

  • @user-ws1ov4ub1f
    @user-ws1ov4ub1f Před 5 dny

    确实是要Go Fundamental,往深里去。学者王云五就曾说:为学当如群山式,一峰突起众峰环。非常认同视频中所讲到的--到达这个山峰的最高点就很容易看到另一个山峰的最高点。

  • @lilaxe5715
    @lilaxe5715 Před 5 dny

    讲得挺好,感谢分享

  • @mavershang
    @mavershang Před 6 dny

    ollama + mistral linux 本地成功,问题是query的时候很慢,200 token花了140s。另外一个问题是不知道是不是我配置有问题,ollama只能用到一块GPU。机器是4x A100 40GB

    • @ericxu9566
      @ericxu9566 Před 3 dny

      请问试过geema2:27b没,感觉中文它更强

    • @huanyihe777
      @huanyihe777 Před dnem

      Ollama好像是自动分配CPU和GPU

  • @afonsode419
    @afonsode419 Před 7 dny

    這講的很好 可惜還是虛了點 您可以舉一百個例子 做個一百期 具體的應用 讓更多人開釋

    • @huanyihe777
      @huanyihe777 Před 6 dny

      等我自己积累多一些,就再来一期分享

  • @hhhlll6510
    @hhhlll6510 Před 7 dny

    太厉害了

  • @zhulin6948
    @zhulin6948 Před 7 dny

    请问博主,Qwen2用ollama运行的时候无法直接读取网页链接,gemma就没有问题,这个是大模型功能问题吗

  • @huanyihe777
    @huanyihe777 Před 7 dny

    Patreon已上线,欢迎加入:www.patreon.com/newtype_ai

  • @user-sq1jv7fc5g
    @user-sq1jv7fc5g Před 8 dny

    之前用llama-index做过类似的事情,发现graph类型的索引在后期维护的时候非常困难,尤其是跨文档的关联还有索引删除的时候,不知道是不是我对于graph索引的理解不到位

    • @huanyihe777
      @huanyihe777 Před dnem

      这确实是大问题。当文档、数据集发生变化时,又得再来一遍索引创建,很头疼。

  • @qiuchenzhang3721
    @qiuchenzhang3721 Před 8 dny

    如果模型没有gguf文件,怎么办呢

  • @xinchen6512
    @xinchen6512 Před 8 dny

    听你讲的感觉,目前确实用不了这个玩意,等等新的好用的:)

  • @dingkuns
    @dingkuns Před 9 dny

    中国大陆产的软件,还涉及到核心业务,坚决不用

  • @cocoamax8100
    @cocoamax8100 Před 11 dny

    你使用本地模型跑,慢的原因应该不是模型参数体量的问题,大概率是你本地GPU估计不行,token吐的慢

  • @呀咧呀咧
    @呀咧呀咧 Před 11 dny

    會這麼貴的另外一個原因是因為你用了gpt4-turbo而不是gpt-4o

  • @chowx4gt-gc8io
    @chowx4gt-gc8io Před 11 dny

    tqvm

  • @weijunLeung
    @weijunLeung Před 12 dny

    有没有dify的系列课程?适合非代码人员学习的?

  • @tonyw8321
    @tonyw8321 Před 12 dny

    API 换成 gemini 1.5 flash 会快很多。而且便宜很多。 但我不知道他支不支持gemini

  • @rogerroan7583
    @rogerroan7583 Před 12 dny

    刷老闆的卡就不心疼了

  • @lee1221ee
    @lee1221ee Před 12 dny

    11美元會不會是生成entity,只需跑一次而已,後續每問一次比較便宜?

  • @LordRayleigh55
    @LordRayleigh55 Před 13 dny

    关于使用本地大模型方面,试了Ollama+Mistral+Nomic,通过github上的一些tricks可以构建索引,但是query的时候本地模型好像不能生成json格式的responds,导致报错;后面估计GraphRag更新之后可能会解决。 但是本地模型效果可能还是能力有限

  • @tudminer
    @tudminer Před 13 dny

    ollma 的 llama3 做出来效果好吗

    • @huanyihe777
      @huanyihe777 Před 12 dny

      肯定是不如GPT-4的,毕竟性能摆在那里。

  • @yaoren549
    @yaoren549 Před 13 dny

    本地模型嵌入不能用lm-studio,需要用llama.cpp

  • @bochen0210
    @bochen0210 Před 13 dny

    This video didn’t age well I guess😮

  • @zxjason
    @zxjason Před 13 dny

    我刚看了一个老哥用ollama和GraphRAG一起

    • @huanyihe777
      @huanyihe777 Před 13 dny

      Ollama和LM Studio,各种组合都试过了,不行。不知道是不是Windows系统的原因

    • @huanyihe777
      @huanyihe777 Před 13 dny

      别人在Mac、Ubuntu成功了

  • @adrenfu6238
    @adrenfu6238 Před 13 dny

    能采用 hosted llama3 70b 比如deepinfra 平台,成本低也很快

  • @HomunMage
    @HomunMage Před 13 dny

    很認同,其實最終就是要走localLLM,但目前GraphRAG只能靠gpt4 api key

    • @manyes7577
      @manyes7577 Před 11 dny

      3.5不是比較便宜 為什麼要用4

    • @HomunMage
      @HomunMage Před 10 dny

      @@manyes7577 能力完全在不同次元

    • @HomunMage
      @HomunMage Před 10 dny

      @@manyes7577 跑這種演算法都要api key喔 只有網頁版的聊天才不用付費 另外 3.5和4o解決能力在不同次元

    • @HomunMage
      @HomunMage Před 10 dny

      @@manyes7577 因為能力完全在不同的次元

  • @richardchieng9252
    @richardchieng9252 Před 13 dny

    这个成本是分两部分的吧,建立索引多少消耗,单次查询多少消耗,能不能分开给一下数据?如果大头在建立索引,而单次查询的边际成本可控的话,我觉得这个还是比较有前途的

  • @Sulzbach-dk7ov
    @Sulzbach-dk7ov Před 13 dny

    一本書summary30分鐘+11美金不是問題,這個成本還是比真人便宜太多了。想像一下一間出版社直接用這個來審內容,一天一個api key可以500美金審完48本書,比工讀生還便宜

    • @chungrandy780
      @chungrandy780 Před 13 dny

      但是如果要對書中內容進行多個問答,就會是很嚇人的成本了

    • @huanyihe777
      @huanyihe777 Před 13 dny

      在我这个例子里,索引大概要10美元

  • @guocity
    @guocity Před 13 dny

    能共享一下github 库吗?

  • @youwang9156
    @youwang9156 Před 13 dny

    up主 有微信群吗,求加

    • @huanyihe777
      @huanyihe777 Před 13 dny

      没有,只有知识星球或者Patreon

  • @dennislau1440
    @dennislau1440 Před 13 dny

    非常好的视频!@huanyihe777 有没有找环境试一下开源的:通义千问或者70B的LLama3私有化部署效果怎样?这样成本就下来了。

  • @tianyinhuang
    @tianyinhuang Před 13 dny

    @huanyihe777 能不能把11美刀的成分拆分成创建和推理两部分,然后分享一下? 🙏❤ 现在2B的使用场景很多是比较固定的知识库,创建成本高一点是可以接受的。

    • @harrydu6955
      @harrydu6955 Před 13 dny

      知识库只需要创建一次。推理可以反复用

    • @huanyihe777
      @huanyihe777 Před 13 dny

      在我这个例子里,索引大概要10美元

  • @fish-wz4pr
    @fish-wz4pr Před 13 dny

    格式只限制txt fav,把csv丟進去也不理解,一樣有答非所問狀況, 用gpt4o

    • @huanyihe777
      @huanyihe777 Před 13 dny

      表格这种,最终估计只能多模态处理

  • @Design-Enjoyment-Happiness

    說得太好了...以前用RAG看他撈出來的資料都很無奈

  • @3a146
    @3a146 Před 13 dny

    没事, 我有挺多GPU的, 大概有十来个吧. 还有128GB mbp, 训练跑不动还跑不动推理么. 我一直想自己用图计算的方式解决遍历内容的问题, 但是我就知道做了也是白费功夫, 因为有人会给我喂饭的, 等的就是这一天.

    • @3a146
      @3a146 Před 13 dny

      而且还可以退回去用3.5嘛.

    • @simonren4890
      @simonren4890 Před 12 dny

      哈哈。最好一句戳中我了,每次都想有人给我喂饭,所以现在天天调包。

    • @3a146
      @3a146 Před 12 dny

      @@simonren4890 没事,我是搞程序语言理论和代数拓扑的,还没见过我不能准确把握性质的包,这种包理论上就不可能存在。

    • @simonren4890
      @simonren4890 Před 12 dny

      @@3a146 厉害啊,我太了解代数拓扑,只能大概知道概念,它是不是图计算的源头基础?

    • @3a146
      @3a146 Před 11 dny

      @@simonren4890 我这么说吧, 代数拓扑回答的是“能不能对齐颗粒度”的问题. 图论回答的是“颗粒和颗粒之间的关系怎么回事”的问题. 对齐颗粒度的时候可以用很多细的去解释一个粗的, 图论的颗粒基本都是对称的, 没有质的差别. 当然代数拓扑的“颗粒度”实际上叫做代数不变量, 典型的叫做基本群, 是用套圈去试空间里面的孔洞那么试出来的, 如果有孔洞你的套圈收缩的时候行为就会不一样. 因为不同的套圈能够串起来, 形成新的套圈, 这样就是代数了. 考虑一个空间对象, 这样试出来不同的元素服从特定群的规则. 然后如果两个空间的群同构, 那它们俩就可以通过对应套圈达到“对齐颗粒度”的目的, 然后它们同伦等价, 属于同一个同伦等价类. 另外, 同伦基本群也不是唯一的代数不变量.

  • @wumitiyo9754
    @wumitiyo9754 Před 13 dny

    本地模型网上是有成功的,但我用一样的方法还是报错,我最多示例文档跑了一个小时,看了下运行的时候显卡很多时候都要跑100%,估计是性能不够赶不上生成速度就报错了,估计上4090应该就可以了

    • @leonwu355
      @leonwu355 Před 13 dny

      4090用户告诉你,文件大了一样卡😂,不过我折腾了两个晚上,找到了一个替代方案,用glm 4的本地模型再加glm的网上的embedding api。

    • @wumitiyo9754
      @wumitiyo9754 Před 13 dny

      @@leonwu355 回去试试,这样成本确实低了很多,就不知道3060能不能跑起来了

    • @leonwu355
      @leonwu355 Před 13 dny

      @@wumitiyo9754 问题不大,也可以deepseek 替代

    • @huanyihe777
      @huanyihe777 Před 13 dny

      我特意换了小文档,到了嵌入阶段一样报错,放弃了

    • @wumitiyo9754
      @wumitiyo9754 Před 12 dny

      @@huanyihe777 实测用3060的显卡,和ollama的gemma2加上lm-studio的nomic-embed-text-v1.5.Q5_K_M.gguf嵌入是可以的,我把示例的书删减到8万字,花了一个多小时。这个速度太感人,换个好点的显卡应该可以处理百万字数的书了。

  • @AlangHsu
    @AlangHsu Před 14 dny

    謝謝你的分享。原本也想試試這個,看來你點出了一個很關鍵的問題:即使改善了精確度,可是耗費成本絕對是需要被考慮的,不管是個人用或企業用。

    • @huanyihe777
      @huanyihe777 Před 14 dny

      等token费用再降一降,或者改用GPT-3.5,也许可行