Verbal Content Input Structuring - CN

语音内容智能结构化处理工具

Verbal Content Input Structuring - CN 是专门为投资分析师/知识工作者设计的语音转录内容结构化工具。它能够从会议记录、访谈录音、演讲视频等语音内容的转录文本中，智能提取关键信息、识别发言人观点、整理论证逻辑，并按照标准化格式输出，极大提升分析师对语音内容的理解和归档效率。

目的与价值

语音信息提取

从复杂的转录文本中精准识别发言人身份和观点表达

客观信息传达

以投资分析师/知识工作者视角客观整理发言内容，区分观点与事实

时序逻辑保持

按原始时间顺序整理信息，保持讨论的自然流程

核心价值主张

专业语音分析

专门针对投资研究场景的语音内容处理

发言人识别

清晰标注每个发言人的身份和观点

实例完整保留

重点保留发言人的原始例子和比喻

智能降噪处理

自动识别转录错误并基于上下文修正

核心方法论

三层分析法

客观视角

以投资分析师/知识工作者身份客观分析内容

身份识别

精确识别每个发言人的身份和观点

原文保留

完整保留关键例子和比喻的原文

智能分析原则

区分发言人观点与客观事实
保持原始时间顺序和逻辑流程
重点标注关键洞察和核心论点
智能识别并修正转录错误

信息优先级

1 核心逻辑和支撑论据

2 发言人身份和观点归属

3 具体例子和数据支撑

4 修辞性和过渡性内容

详细工作流程

核心逻辑提取

首先总结整个转录内容的核心信息和支撑论点，形成一段完整的逻辑概述

输出位置：### Key Logic 部分

注意：这是固定格式，不可更改

发言人身份识别

按原始时间顺序识别每个主题下的发言人身份和具体表达内容

身份标注

观点提取

例子保留

格式化输出

按照严格的Obsidian语法规范格式化输出，确保后续分析的便利性

三级标题

实体链接

数字高亮

标签生成

输出格式规范

标准输出结构

### Key Logic
转录内容的核心信息及支撑论点的完整概述（中文）

### 第一个主题或方面的句子
- 某某发言人从某某地方表达/询问了什么（一句话概述）
    - 发言人表达的细节1
    - 发言人表达的重要细节2
        - "发言人举的例子和比喻的原文（翻译为中文）"
- 另一位发言人从某某地方表达/询问了什么
    - 发言人表达的细节1
    - 发言人表达的细节2

### 第二个主题或方面的句子
- 某某发言人从某某地方表达/询问了什么
    - 发言人表达的细节1
    - 发言人表达的细节2

#tag1 #tag2 #tag3 ... (至少10个英文标签)

层级结构要求

• 一级：### + 主题句
• 二级：- 发言人身份+简述
• 三级：具体观点细节
• 重要内容：加粗标注
• 原文引用：子级要点+中文翻译

语音内容特殊处理

• 必须明确标注发言人身份
• 保持原始时间顺序
• 完整保留例子和比喻
• 智能修正转录错误
• 区分观点与事实

语法规则详解

发言人标识规则

- Andrew Ng指出...

明确身份：姓名+动词

- 主持人询问...

角色身份：职务+动词

- 斯坦福研究员提问...

机构+职务：完整身份标识

原文保留规则

- "AI如同让人一次性写完文章"

比喻类：必须保留原文

- "我有一个有争议的观点，我认为现在是每个人，无论什么职位都应该学习编程的时候"

重要观点：保留关键表述

- "快速行动，承担责任"

核心理念：保留原始表达

实体链接规则

AI Fund

Coursera

GitHub Copilot

所有实体名称必须使用英文，并转换为带title气泡的span

数字高亮与标签

平均每月孵化1个初创公司

数字+单位：仅高亮数字（使用span）

#AI_fund #startup_speed #concrete_ideas

标签：全英文，至少10个，放于文档末尾

应用场景

投资会议纪要

董事会会议记录整理
投资决策讨论纪要
尽职调查访谈记录

专家访谈整理

行业专家深度访谈
公司管理层访谈
第三方机构调研

会议视频处理

业绩说明会录音整理
路演视频内容提取
行业会议演讲整理

播客和讲座

投资主题播客整理
学术讲座内容提取
在线研讨会记录

处理效率统计

使用示例 (Live Example)

这是一个真实使用场景，展示了如何将Andrew Ng在斯坦福大学创业学校的演讲视频转录，通过本工具转化为结构化的投资分析笔记。

查看 Prompt 原文观看原始视频

原始转录输入 (Original Transcript)

It's really great to see all of you. What I want to do today since this is build as startup school is share with you some lessons I've learned about building startups at AI fund. AI funds a venture studio and we build an average of about one startup per month. And because we co-founded startups, we're in there writing code, talking about customers, design on features, detering pricing, hiring, fundraising, all of that. And what that's taught me is that the single greatest predictor of startup success today is speed of execution. And the new AI technologies are dramatically accelerating startup building. And so I want to tell you about some of the things that we've seen working for us. I think there
are some common misconceptions that I'm also finding myself
dispelling when talking to entrepreneurs.
So, you know, the first thing is about the AI stack. So at the very bottom you have semiconductor companies. And on top of that, you have the Hyperscalers, the cloud service providers. On top of that, you have the Foundation model companies, Large Language model companies. And then on top of that, you have the application layer. And by definition, the biggest opportunities must be at the application layer because applications have to make enough revenue to pay the foundation models, to pay the cloud, to pay the semiconductors to sustain their entire ecosystem. There are opportunities at every layer of the AI stack, sure. But I think opportunities at the application layer are larger.
So, you know, the media and social media tends to focus less on the application layer. Hopefully this talk will help change your mind.

Let's talk about speedy execution. One of the things that I find most exciting about AI, and it's also creating a lot more opportunities for startups, is the rise of what I call Agentic AI. So the way large language models have been used is, you give it a prompt and it generates a continuous output. That's like asking a human being to write an entire article in one go without being able to revise it. And that's not how humans write best, and it's not how AI does best either. And so Agentic workflows are where you allow the AI system to iterate. So for example, first write a paper outline, then go and research the web to get some web pages. Then write a first draft, then read your first draft and critically revise it. So through multiple cycles, it's slower, but it produces a much better work product. And in many of our projects at AI Fund, whether it's processing complex compliance documents to medical diagnosis, to reasoning about complex legal documents, I find that Agentic workflows are the key differentiator for whether or not the work works. So in the past year, there's been a new layer of the AI stack, what I call the Agentic orchestration layer, that's making it easier for application builders to orchestrate calls to the underlying technology layers, like foundation models, cloud services. But the conclusion for me is still that the application layer is the most valuable place to be in the stack, and I continue to prefer to focus on the application layer.

[... 完整演讲内容 ...]

... and we still have to keep up that work to to protect open source thank you all very much it's wonderful to see my thank you

原始转录特点：语音识别可能存在错误，需要基于上下文智能修正，但这里为了示例完整性，展示了较长的原文片段。

结构化输出 (Structured Output)

Key Logic

此次演讲的核心信息是，在人工智能快速发展的时代，创业成功的强大预测因子是执行速度，而新的AI技术正在极大地加速创业公司的发展。Andrew Ng强调，最大的创业机会位于AI堆栈的应用层，并通过推广Agentic AI工作流、鼓励构建具体想法、利用专家直觉、专注于单一假设、以及采纳AI辅助编程和快速产品反馈策略来提升速度。他还指出，理解AI技术本身能够帮助创业者做出更快的决策，因为AI构建模块的组合效应呈指数级增长，同时呼吁赋能每个人学习如何利用AI工具，并警惕围绕AI的过度炒作和对开放生态的威胁，强调在追求速度的同时也需肩负社会责任。

AI时代的创业机遇与AI堆栈

Andrew Ng指出，AI Fund是一个风险工作室，平均每月孵化一个初创公司，这使其有机会亲身参与创业过程，从而理解如何利用AI技术加速发展。
Andrew Ng说明了AI堆栈的层次结构，并强调应用层拥有最大的商业机会。
- 最底层是半导体公司。
- 其上构建的是云服务提供商。
- 再往上是AI基础模型公司。
- 应用层（Application Layer）机会最大：
  - 尽管媒体和社交媒体倾向于不那么关注应用层，但从定义上讲，最大的机会必须在那里。
  - 因为应用需要产生更多的收入来支付给基础模型、云和半导体技术层，才能维持整个生态系统的运转。
  - 当然，AI堆栈的各个层级都存在机会。

Agentic AI及其工作流对效率的提升

Andrew Ng解释了Agentic AI的兴起，以及为什么它在技术上令人兴奋并带来更多创业机会。
- 过去的大语言模型使用方式：通常是向其提供一个提示，然后生成一个连续的输出。
  - 如同让人一次性写完一篇文章，不能修改，这并非最佳写作方式，对于AI也是如此。
- Agentic工作流：
  - 允许AI系统迭代地完成任务，例如：
    - 首先撰写论文大纲。
    - 然后进行网络研究并获取相关网页信息。
    - 接着撰写初稿。
    - 再阅读初稿并进行批判性修订。
  - “通过多次循环，虽然速度较慢，但能产生更好的工作产品。”
  - 在AI Fund的许多项目中，从处理复杂的合规文件到医疗诊断，再到推理复杂的法律文件，Agentic工作流是“决定工作成功与否的关键差异”。
- AI堆栈的更新：
  - 在过去一年中，出现了一个新的Agentic编排层，帮助应用程序开发者协调对底层技术层（如基础模型和云服务）的调用。
  - 这个编排层使得构建应用程序变得更加容易。
  - 结论依然是应用层在堆栈中占据最有价值的位置，并且会更倾向于专注于应用层。

创业加速的最佳实践：具体想法、专家直觉、单点突破与快速反馈循环

Andrew Ng分享了创业公司如何加快速度的最佳实践。
- 专注于“具体想法”（Concrete Ideas）：
  - 一个具体的产品想法是足够详细，工程师可以直接构建的。
    - “如果一个想法很模糊，比如‘用AI优化医疗资产’，这太模糊了，不同的工程师会做完全不同的事情，无法快速构建。”
    - “相反，如果想法具体，比如‘开发软件让医院病人在线预订MR机器时段以优化利用率’，工程师就能快速构建。”
  - “具象性带来速度”，即使最终发现是一个不好的想法，也能很快发现并转向。
  - 模糊的想法容易获得赞扬（“那是好主意”），但难以落地。具象的想法则可能对也可能错，但能够快速得知结果。
  - 好处：提供了清晰的方向，团队可以快速行动来验证或证伪它。
- 利用“专家直觉”（Subject Matter Expert Gut）：
  - 寻找在某个领域长期思考过问题的主题专家，他们的“直觉”往往能做出快速且出奇的好决策。
  - “虽然我从事AI工作，热爱数据，但在许多初创公司，获取数据本身是缓慢的决策机制。”
  - “一个拥有出色直觉的主题专家，在做快速决策时，往往是更好的机制。”
  - 例如，Andrew Ng在创立Coursera之前，曾花费数年时间思考在线教育并与用户交流，形成了对平台构建的直觉。
- 追求“单一明确的假设”（Single Clear Hypothesis）：
  - 大多数成功的初创公司在任何给定时间都只追求一个非常明确的假设。
  - “初创公司没有资源同时对冲并尝试10件事情。”
  - 如果数据表明这个想法行不通，可以快速转向一个完全不同的具体想法，并以同样的决心去追求。
  - “如果每一条新数据都导致你转向，那可能意味着你最初的知识基础太弱了。”

AI对软件工程和开发者生产力的影响

Andrew Ng讨论了AI如何改变软件工程中的反馈循环。
- 客户接受度是最大的风险：许多初创公司失败不是因为无法构建想要的东西，而是因为构建出来的东西无人关心。
- AI代码辅助正在实现快速工程化。
  - 工程速度正在快速提升，工程成本正在快速下降。
- 两类代码：
  1. 快速原型（Quick and Dirty Prototypes）：用于测试想法。
    - 他认为AI使构建原型速度提升了至少10倍，甚至更多。
    - 原因是原型与现有软件、基础设施和数据的集成度要求较低。
    - 对可靠性、可扩展性甚至安全性要求较低：“我经常告诉我的团队‘放心地写不安全的代码’，如果软件只在个人笔记本上运行且无恶意攻击，那是没问题的。”（但在发布前必须确保安全和可扩展性。）
    - 现在创业公司可以系统地构建20个原型来发现哪个可行。
    - “如果一个概念验证的成本足够低，那么即使很多概念验证最终未能投入生产，也完全没问题。”
  2. 生产级维护代码（Maintain Production Software）：
    - 在编写生产质量代码时，AI可能提高30%到50%的速度。
- “快速行动，承担责任”（Move fast and be responsible）：以前的“快速行动，打破常规”名声不佳，但他认为不应放弃“快速行动”，而是要“快速行动并负责任”。
- AI编码助手演进：
  - 3-4年前是代码自动补全（GitHub Copilot）。
  - 之后是支持AI的IDE。
  - 大约6-7个月前，出现了新一代高度Agentic编码助手（例如Claude CodeX使用Claude 3）。
  - 这些工具使得开发者生产力持续提升，保持工具更新至关重要。
- 代码的价值降低：
  - 过去代码被认为是高价值产物，因为创建困难。
  - 现在软件工程成本下降，代码的价值也随之下降。
  - “我们团队曾在一个月内完全重建了代码库三次，因为现在重建代码库并不难。”
- “双向门”与“单向门”（Two-way Door vs. One-way Door）：
  - Jeff Bezos的术语：双向门决策是可逆成本低的，单向门决策是成本高或难以逆转的。
  - 以前选择技术栈、数据库schema曾是单向门。
  - 现在软件工程成本大幅降低，许多曾被认为是单向门的决策，现在变得更接近双向门。
  - “我的团队现在更频繁地会在一个技术栈上构建一周，然后决定扔掉代码库，用新栈从头开始。” 虽然不是总这样，但成本确实降低了，这改变了决策模式。

赋能所有人学习编程以及AI工具的使用

Andrew Ng认为现在是赋能所有人利用AI进行构建的好时机。
- 过去一年，一些人建议不要学习编程，理由是AI会自动化它，但他认为这是“最糟糕的职业建议之一”。
- 当更好的工具使软件工程变得更容易时，应该有更多人学习，而不是更少人。
- 历史回顾：从穿孔卡片到键盘，从汇编语言到高级语言，每次技术进步都让编程更容易，反而吸引了更多人学习。
- “我有一个有争议的观点，我认为现在是每个人，无论什么职位都应该学习编程的时候。”
  - 在他的团队中，包括CFO、人才负责人、招聘人员、前台都懂得编程，并且他们各自的工作表现都更好了。
- “未来，能够‘告诉电脑你确切想要什么’的人将是最有力量的。”
- 学习编程（不一定需要自己写所有代码，而是引导AI为你写代码）仍然是做到这一点最好的方式。
- Midjourney的例子：
  - 懂得艺术史的团队成员，能够给Midjourney提供精确的提示（流派、调色板、艺术灵感），从而生成高质量的图片。
  - 相对于Andrew Ng自己只会说“请给我画漂亮的机器人图片”，无法获得同等控制力。

产品管理瓶颈与获取反馈的策略

Andrew Ng观察到软件工程速度提升后，产品管理（Product Management）工作成为了瓶颈。
- 一年以来，许多团队抱怨瓶颈转移到了产品工程和设计上，因为工程师的速度提升显著。
- 过去硅谷的经验法则：1个PM对应4-7个工程师。
- 现在这种比例正在改变：有人甚至提议为1个PM配备0.5个工程师（即PM人数为工程师的两倍）。他认为这表明了未来的趋势。
- 快速反馈对PM至关重要：
  - 一个能够快速获得反馈来塑造产品方向的PM，在工程速度提升的背景下，也能帮助团队保持快速。
  - 获取产品反馈的策略组合（从快到慢，从不准确到准确）：
    1. 最快：依靠自己的直觉（如果你是主题专家，这会出奇地好）。
    2. 稍慢：询问3位朋友或队友的反馈。
    3. 再慢一点：询问3到10位陌生人的反馈。
      - Andrew Ng学会了在咖啡馆或酒店大堂等高人流量的地方，礼貌地向陌生人征求对其产品的反馈。
    4. 更慢：将原型发给100名测试者。
    5. 最慢：A/B测试。
      - Andrew Ng指出，尽管硅谷推崇A/B测试，但现在它反而是他菜单中最慢的策略之一。
  - A/B测试的真正价值：
    - 不仅仅是选择产品A或产品B，更重要的是“仔细研究数据以磨练直觉”，从而能够更快地做出高质量的决策。
    - “通过所有这些数据来更新我们的心智模型，从而提高我们做产品决策的速度。”

问答环节 (Q&A)

人类与AI工具的关系：发展工具还是学习使用工具？
- Andrew Ng认为AGI被过度炒作了，人类在很长一段时间内仍将做许多AI无法做到的事情。
- 未来最有力量的人是那些“能够让电脑做你确切想的事情”的人。
- 学习如何使用AI让电脑为你工作，将使人比不使用AI的人更有力量。
计算的未来方向？
- 有人提及将GPU送入太空、核能数据中心等。
- Andrew Ng认为这都是过度炒作。
- “这些炒作叙事让某些企业看起来更强大，并帮助它们进行融资。”
- 他列举了AI相关的“虚假炒作叙事”：
  - “‘AI如此强大，我们可能会不小心导致人类灭绝’——荒谬的。”
  - “‘AI如此强大，很快没人会有工作’——不真实。”
  - “‘通过训练一个新模型，我们将轻易消灭数千家初创公司’——不真实。”（只有少数公司受影响。）
  - “‘AI需要这么多电力，只有核能才够用’——不真实。”
- “GPU在太空？我觉得我们地球上的GPU还有很大的发展空间。”
初创公司在“任何东西都可能被颠覆”的时代如何思考护城河？
- Andrew Ng认为最重要的是“你是否正在构建用户喜爱的产品”。
- 其他因素（如进入市场渠道、定价、护城河）也很重要，但优先级低于产品被喜爱。
- “我发现护城河往往被过度炒作了。”
- 护城河通常是随着产品的发展而演进出来的，而非一开始就存在。
- 面对大量未被满足的需求（“大量的空白领域”），创业公司应专注于产品需求，护城河的问题可以在后续解决。
公众对AI的教育：是否需要让非技术人员理解深度学习？
- Andrew Ng表示DeepLearning.AI致力于赋能每个人使用AI，并相信知识会传播。
- 他认为主要有两个危险：
  1. 未能足够快地“带所有人一起前进”。
  2. “守门人”效应：像移动生态系统（Android和iOS）一样，如果少数公司控制了AI基础模型，将扼杀创新。
    - 他批评了某些企业夸大AI危险，试图推动监管（如加州的SB 1047法案），从而阻止开源和开放权重软件的发布，目的是成为“守门人”。
    - “如果这些监管提案成功，并最终导致监管被截流，使得每个人都需要少数公司的许可才能对模型进行微调或以特定方式进行提示，那将扼杀创新。”
- 因此，保护开源和开放权重模型，防止这种攻击线路取得成功，至关重要。

设计理念

核心设计原则

客观性

以投资分析师/知识工作者视角客观传达信息，区分观点与事实

时序性

保持原始时间顺序，维护讨论的自然流程

完整性

完整保留关键例子和比喻的原文表达

语音内容特化

发言人识别

精确标注每个发言人的身份和观点归属

转录错误修正

基于上下文智能识别并修正语音识别错误

原文保真度

重要表述和例子保持原汁原味

投资分析优化

信息层级

按重要性对信息进行分层处理

实体标准化

统一实体命名便于后续关联分析

标签体系

生成丰富标签便于知识库检索

持续优化方向

智能化提升

更准确的发言人识别和情感分析

多语言支持

支持更多语言的转录内容处理

知识图谱

自动构建实体关系网络

Verbal Content Input Structuring - CN - 语音内容智能结构化工具

导航菜单