研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大机会！（二） - 临沂少儿编程信息学奥赛机器人积木无人机科技创新培训机构

研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大机会！（二）

对于原生的AI产品，它的机会在哪里？它的新能力如何应用于新场景？原生的商业设计应该怎么来做？

，创新领教、前京东O2O副总裁、人工智能Get的CEO。作为少数真正懂技术，而且亲手做过人工智能项目的产品专家，他对AI的理解独到且深刻。

本次更新的课程内容，他围绕AI商业新时代的原生产品机会、新能力和商业设计三方面。在人工智能加持下，创业者如何以史为鉴，抓住原生的产品机会？如何充分地利用新科技创造的新能力和新场景？结合丰富的AI新产品使用体验，老师一次性解释清楚了人工智能时代创业者建立核心竞争力的方法。

他说：“对于大部分创新者、创业者来讲，我们一定要思考的是如何从新科技带来的新能力、新场景中长出新东西。我们生活在数字世界，但是我们的脑子好像被纸和笔框住了很多，以至于我们没有最大化地利用数字科技的作用。”

在一个加速变化的时代，我们要从新能力和新场景出发，拥有拿着锤子找钉子般的精神，创造竞争优势。以下内容整理自老师的AI系列课程。

【前情提要】点击链接查看老师之前的课程干货：研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大的机会！

《AI·新商业洞察系列课22讲》，全网既讲AI的底层逻辑，又讲AI的工具和应用的课程，包含商业实战应用、组织和个人的生产力提升。现在起，新同学购买可享受100元优惠，早鸟价299元拿下22讲课程！

AI时代的新机会在何处

关于AI时代的新的原生产品机会，这是对于未来的预测。我们可以以史为鉴，看一看上一次科技浪潮的时候，它的原生产品机会是什么样子，哪些人抓住了，哪些人没有抓住，以及从中得到的教训。

在移动互联网出现之前，我们使用PC端上网。移动互联网时代的到来，很多人开始思考如何抓住机会，实现移动互联网的效果最大化。这个时候出现了两种思路：一种是把原来在PC互联网时代成功的模式挪动到移动互联网时代。比如将PC互联网时代打造的门户网站运用于移动互联网时代，打造3G门户。另外一种思路是一脉相承，内容不变，实现载体的转换，如电脑端的百度搜索变成手机搜索，在PC互联网时代的社交转换为移动社交。这些思路都是将在PC互联网上做得比较好的产品搬到移动互联网上。

按照这种思路，有的获得了成功，如社交网络的出现，有的并未成功，如3G门户。除了在微信上花费时间，主要花在信息流服务上，比如今日头条、快手、抖音，还会花在本地服务上，如美团点评。所以，从PC端转移到移动端，产品形态是否能够成功转移，获得生存，这是值得思考的问题。

换一种思路，我们不去把一个旧的商业模式和旧的产品形态挪到新的科技应用上，而是思考如何用新科技为我们提供新能力来塑造产品。比如微信，它用到了语音输入和随时随地两个新能力，把社交网络变得更大。语音输入可以将很多原本并不熟悉打字输入的人，加入到社交网络，随时随地让微信的社交网络变成了24小时在线的网络。对于抖音来说，它运用了摄像头和碎片时间的新能力。每个手机自带的摄像头，赋予了每个人新的能力。当10亿人在手机上有了摄像头之后，打开了一个新的市场空间。每个人都有一部手机，拥有了大量的碎片时间来消费内容。抖音、快手这样的应用能够崛起，是因为每一个人都成为了生产者，充分地利用了新的科技创造的新能力和新场景。美团利用了新科技中的GPS定位系统。每一个用户的手机上都有GPS定位，打开程序就知道你在何地以及附近的店。我们也可以知道快递小哥在哪里，智能地调度取餐地点，甚至是拼单，让每一个订单的配送效率更高，成本更低，做好本地服务。

真的能够在这一波浪潮当中崛起的，往往都是最充分地利用了新科技带来的新能力和新场景。所以有的时候思考一件事情，不一定要从用户需求出发。对于创新创业公司，我们应该发挥新科技的新能力和新场景，从新能力和新场景出发，设计我的产品，如同拿着锤子找钉子般，把新锤子具备的新特点充分发挥出来，创造竞争优势。

具体来说，上一波移动互联网的新能力有麦克风、摄像头、触控屏、陀螺仪、GPS定位。移动互联网创造了随时、随地、随身、碎片化时间和长时间的新场景。这些新能力和新场景打开了低成本、低门槛的新人群。所以用上新科技带来的新能力，出现在新科技创造的新场景中，优先地考虑新人群的需求，才能做出移动互联网的原生应用，在移动互联网浪潮中找到新的生态位。

应用在产品上的六大新能力

对于大部分创新者、创业者来讲，我们一定要思考的是如何从新科技带来的新能力、新场景中长出新东西。我们生活在数字世界，但是我们的脑子好像还是被纸和笔框住了很多，以至于我们没有最大化地利用数字科技的作用。我觉得拥有新能力，思考它可以用来做什么，如何用上它，是打开思路的正确方式。

点击下图，加入课程⬇

第一个新能力是自然语言理解能力。具体来讲，我们可以采用两种方式理解这个新能力：第一种是机器能听得懂人的话语，人不再用学机器的话。对于绝大部分初学者而言，可以直接跟机器说出你的需求，机器就会满足你。比如ChatPDF，这个时候你不用说话，把想要读的文档给它，它就可以帮你读文档，还可以跟它聊天。飞书可以直接把会议纪要生成代办事项，根据Word，做成PPT，生成内容、文档、指令。大部分人都会使用Excel软件，所以不会觉得这是件了不起的事情。但是很多人不会用SQL，如果数据库听得懂人的语言，它就会帮你把SQL写出来，可以节省大量的时间。它的自然语言识别，不光是识别与我们的对话，也用来识别我们所存储的所有的信息，从而为我们节省了大量的检索和记忆时间。GLEAN是一个可以将公司里面的各种资料全部汇总的工具，每次有疑问，就可以直接问机器人，极大地减少了相互之间沟通的时间。自然语言理解不仅意味着机器能够听懂人的语言，还可以帮我们去理解更多的世界，用更简单的方式把世界告诉我们。

第二个新能力是自然语言表达能力。一方面是所有的内容，所有的形态；另一方面是特定的内容，特定的形态。世界上所有的内容，所有的形态都是可以靠GPT来帮助生成的，对于你的行业，你可以思考可以用来做什么。特定的内容乘以特定的形态，意味着根据每个人的兴趣点，挖掘内容的价值，更有效地服务每一个人，不再需要每个人完整地消化内容。

在Google刚刚出现的时候，很多人因为搜索引擎收录网站产生了争论，但是现在大家都觉得合理。这其实处于一个模棱两可的地带。大家可以从两个角度去思考这个问题：第一个是你觉得什么事情是合理的，什么事情是不合理的，把自己的底线划出来。第二个是在底线之上，寻找机会。一旦树立了自己的底线，寻找机会之后，你会发现其实世界上存在着已经积累了数千年的知识，实现知识转化就是机会。

第三个新能力是多模态的理解能力。首先可以感受你能感受的，其次可以理解你想要的。当AI能够感受你的感受的时候，它的智力会得到更充分的表达。我们还没有办法做到完整的自动驾驶，一部分原因是因为自动驾驶不一定具备常识，它不一定能够理解各种路标的含义。一旦它能够理解常识，它的智力就会得到进一步增强。在行业之内，AI除了能够认字之外，还有别的多模态的信息可以训练AI，它可以帮助我们感受到更多的信息，根据这些信息做出更好的判断和更好的服务。

AI的多模态理解能力已经显著地提升，不仅局限在自然语言理解上。在GPT4的报告里面，放了一张，有一个人在计程车后面烫衣服。这个时候他问GPT4说，这张图有什么特别的？GPT4回答道，这张图特别在于这个人在一个车子的后面在熨衣服。你会发现AI理解了车子和人的关系，还理解了这个场景。可见，它已经具备了多模态的理解能力，利用视觉和了解的知识对世界做出精确判断。这样核心的底层技术对于大部分创业者来说，我们很难通过技术本身去塑造核心竞争力和壁垒，但是如果我们比别人先做三个月，有可能可以利用抢先期来打造自己的护城河。

第四个新能力是多模态的表达能力。AI不仅可以生成文字，还可以生成、音频、视频。Tum不仅会帮你写PPT题目，还会帮你每一页配一张图。除了简单的画图，它还会帮你更换房间装修的风格。Discript可以直接对照文本去剪视频，像编辑文字一样进行视频修改。Callannie是一个可以和它直接对话的数字人，它会跟你自然地开始沟通，并且聊天的话题有来有回。

第五个新能力是常识能力，常识分为普遍常识和专业常识。首先它是有普遍常识的，知道长三角地区超过5000员工的客户名单，中东每个国家的销售额。如果AI具备了常识，它就可以精准实现需求。常识对于我们做产品而言，可以搭建原本需要大量的人力、物力付出的场景，实现行业的弯道超车，积攒核心竞争力，尤其是在教育领域。除了普遍常识以外，专业常识能力也十分重要。如果我们可以把某一方面的专业知识从大语言模型里面挖出来，有自己的一套模型方法，在这个领域有一定的稳定性和专业性，很有可能做出各个垂直方向上的专业应用，比如兽医应用。

在原有的多模态的内容创作里，不管是Midjourney还是Stable Diffusion，很多我们用来画画的工具其实不太理解语义，如果结合GPT4的能力，它对于世界是有常识的，可以精准地理解语义，可以理解空间。如果它有了空间知识、世界常识、精准的语义理解，所有的内容生成可以真实地、精准地反映意图。我觉得在多模态的表达方面有非常大的机会。机器在新的能力上开始有了常识，这是移动互联网时代所不具备的。比如你可以问GPT，如果我把中的这根线剪断会怎么样？它会说，那些气球就会飞走。这件事情对于我们每个人都很简单，但是对于机器来说，这是非常难以理解的一件事情，意味着它必须要具备对于这个世界常识的理解，才能够做出判断。再如黑手党到了新的瓷器店，对店主很热情，说类似店好美，东西好看，装修好的话。现在的人工智能可以判断出他的话语看似友好，实际暗示了一种危险。GPT其实还具备了一定的人际交往方面的常识，比如马克和朱迪的对话。马克对朱迪说，我不喜欢你昨天晚上对待杰克的方式。朱迪说，你看到他在做什么了吗？他打了他哥哥的头。马克说，这并不能成为你对他大喊大叫的理由。GPT其实理解双方的意图各自是什么，理解朱迪是如何回看待他们的回应，理解他们为什么没有实际沟通，还能理解他们如何能够改善这个情况。

第六个新能力是推理能力。我们大部分时候要的不是信息，也不是推理，而是信息和推理综合之后的洞察。比如Excel软件，更多的是利用Excel看到一些趋势。未来可以直接让机器帮助我们分析趋势，得出结论。可汗学院做出了AI教育机器人，每当儿童问机器人所有的问题，它们不会直接给答案，而是会问孩子怎么想，引导孩子把这道题目做出来。所有的内容都可以转换为定制化的服务，所有的服务不一定只是信息的过滤和筛选，所有的服务可以是精细地通过推理，判断用户当下的需求。

在我们的新的产品里面，如何把自然语言理解、自然语言表达、多模态理解、多模态表达、常识、推理这些能力用好，我们做出来的产品才更有可能是AI原生的应用能力，根据这些能力往往会创造出更多新的场景。

第一个场景是对话复杂交互的场景。现在跟人工智能讲话比较简单，比如定个闹铃。如果我们能够和AI长时间沟通，就像给助理布置任务一般，把出现的复杂的对话交付场景用起来，我们便具备了竞争优势。

第二个场景是专业门槛消除的场景。如果你是一名设计师或者是董事长，大概率是不会去打开财务软件的。如果未来的产品大部分都携带了自有的AI，这个时候所有软件的交互形态都可以变得极其简单。你可以直接开口问财务软件，它会像财务的专业人员给你解释。所以专业的门槛会逐渐地消除，外行也可以接触到专业性的知识，甚至得到专业的洞察。

第三个的场景是超级定制服务。如果用AI来讲课，首先是让AI收集大量的资料，然后告诉它应该怎样来编排100节课的大内容。它会根据每一个人的信息，比如关心的话题，技术的了解，生成一门专门服务的课程。将所有的内容都变成服务，这是一种新的场景。

第四个场景是软件自由协作。你告诉AI所要学习的内容，AI会自动帮你挑选最合适的工具，然后用你适应的方法做出来。当这些能力被发挥到极致的时候，我们就会打开很多新场景，当我们能够把这些场景充分应用的时候，我们就站在了时代的浪潮。

在《救了我狗命》的故事里，兽医根据ChatGPT分析的验血报告治好了狗的病症。其中用到了自然语言理解，自然语言表达，常识理解的能力。这里面也用到了新的场景：第一个是他跟ChatGPT进行了多次的复杂对话。第二个场景是专业门槛消除，相当于给自己配了一个专业的兽医。第三个场景是定制服务，ChatGPT通过验血报告做了诊断之后，你的信心指数就会极大地上升，这是将内容转换为定制化服务。

当这些新能力和新场景大量地出现，我们也应该开始思考，我们的产品应如何应用新能力和新场景，尽可能把我们的产品放入新场景，牢牢把握未来的机会。

我建议大家在早期的时候拿着锤子找钉子，把这个新能力植入，用到不合理，再把它撤回来，有助于设计AI产品。思考是否可以让产品听懂人的语言来运作，是否可以帮用户理解更多的信息，是否可以生成不同形态的内容，是否可以把固态的内容液化成定制化的服务，是否可以让AI感受到环境和状态，如何用普遍的常识帮助用户，如何提供信息和推理来生产洞察帮助用户等问题，来抓住原生的AI产品机会，用上AI原生的能力，这才是我们的机会所在。

AI时代的原生商业设计

人工智能时代的商业机会，即AI时代的原生商业设计，主要包括定位、产品、商业。

（1）明确定位，寻找突破点

我们做任何的事情，是依据我们所处的位置。当我们站在那里的时候，可以先画几个圈作为参考。第一个圈是用户任务，用户的需求决定了我们如何用AI在原有的产品上创新。第二个圈是AI能力，即人工智能创造的新能力。第三个圈是自身优势，找到自身在这个领域具备的优势，成功率会有显著提升。

这三个圈让我们随时知道自己当下在哪里，用户需求以及AI能力，对于做战略判断更有价值。如果你是一家初创公司，想用比较稳健心态来做AI商业设计，可以找到适合大语言模型的特点往前走。这时候画的三个圈分别是离钱近、有套路、不严谨。离钱近即挑选离钱近的领域，因为大语言模型的底层不属于应用层，我们做出来的AI应用会使得壁垒较薄。如果它的商业闭环比较短，容易变现，可以把这笔钱投入到研发、营销当中。人工智能可以吸收全世界全人类的套路，帮助你一次又一次地稳定输出。这个套路是比较发散性的套路，大语言模型有一定的创造力，意味着它有一定的容错性。律师服务行业属于离钱近、有套路、要求严谨，艺术创作行业属于离钱近、不严谨、套路不多，笔记管理行业属于有套路、不严谨、离钱远。可见，不同的行业，处在这张图不同的位置。营销内容处在比较中间的位置，对于创业公司相对比较友好。首先，它离钱很近，比如百度广告，公众号文案，小红书的种草文案，这一类都是营销内容，营销的内容质量高，会提高转化率。其次，营销可以采用不同的营销方法，从STP到小红书文案，AI可以充分得到套路的训练。最后，营销内容不严谨，它有自己的创造力，不会造成生死存亡的严肃问题。

如果你考虑一定要在自己行业做，也可以这样来考虑：你的行业其实不单是一个行业，而是由很多行业组成。第一个例子是自动驾驶。大部分人认为自动驾驶是离钱近、有套路、严谨的行业，因为它直接跟衣食住行的行相关。实际上，自动驾驶是分场景的。比如说上下班的自动驾驶跟矿车的自动驾驶是两种类型。上下班的自动驾驶旁边会有很多行人，但是矿山的自动驾驶有可能旁边一个人都没有，这个时候矿山的自动驾驶可能就属于离钱近、有套路和不严谨，而街道的自动驾驶就属于离钱近、有套路但是严谨，高速公路上的自动驾驶介于二者之间就是更好的突破口。

所以，对于一个明显的市场，把它切成几块，去分析每一块的情况，判断哪一块更适合自己切入是寻找突破的方法。第二个案例是法律服务。法律服务如果是金融并购，属于离钱近、有套路、严谨，在大的事情上，用专业的律师，因为担心出状况。如果是在小的法律服务上面，比如罚单申诉这样的法律应用场景，属于离钱近、有套路、不严谨，我们可以用AI为用户提供服务。美国的Do Not Pay公司，就是利用AI在不严谨、有套路、离钱近的事情上，帮用户找到非常多的小场景从而提供服务。第三个案例是心理咨询，它属于离钱近、有套路、要求严谨。如果心理咨询不专业，很有可能导致恶性事件。如果是情感陪伴，这个时候就属于有套路、不严谨，但是离钱稍微远一点。值得我们思考的是，是做到更专业的领域，还是更不专业的领域，二者对应着不同的商业策略。我们要知道自己的定位，考虑自己原有的资源。如果本身就有资源，不一定要跟所有的创新者来硬拼。无论如何，要知道自己站在了何处。

（2）基于用户需求，设计合适交互

现在很多人设计产品是想设计一个对话框，因为很多人被ChatGPT误导了。大家可以打破思考的惯性，我们不应该局限在AI的对话形态上，应该思考的是什么新能力适合解决用户的问题。

GITHUB的Copilot，不仅可以和你对话，还可以默默地在后台理解场景，理解上下文信息，给出更正确的代码。NationAI不是一个传统的对话框，更像是一个传统的文档编辑器，用来改写文章。用Jasper对亚马逊的产品描述，首先用图形用户界面让我去填，填好之后生成两个不同的描述，供我选择。这是一种更有效的设计，通过图形用户界面框定应有的信息，而不是随口一说。再如，使用Google搜索内容，Glarity在理解用户的搜索行为和搜索内容之后，会给出一些总结性的答案。

大家思考的原点应该不是对话框，而是新能力，这个时候我们看到的世界才是完整的。很多时候多模态的交互不是对话的形态，可能讲得更清楚。比如手势操作配合语言，是更为丰富的一种交互形式。

Linus Lee曾说过，一次交互过程，不仅是你一句我一句，而是应该拆解成4个部分：意图、上下文、解读和行动这四个方面。每一步的交互我们应该理解这四个方面，然后再去设计，而不是仅仅思考对话。对于产品来讲，我们应该基于这些新能力，而不是从一个对话框出发。整个产品需要从待办任务出发，在我们的核心竞争力以内用上新能力，才能在产品设计角度拥有一席之地。

（3）形成竞争力，打造商业壁垒

AI商业与传统的互联网产品创新不同的地方主要有以下几点：

一是有成本、要赚钱。以前开网站用到的服务器成本跟现在GPT成本相比很小，跟大语言模型说话，都是要付费的，用户多了，成本就会线性增加。如果你的用户每天来回聊大概3000个中文字，用的是3.5接口，大概会用8分钱人民币。如果用的是GPT4接口，大概相当于2元人民币。因此在开始AI商业的时候应该比互联网创业的时候更加具备成本意识，要把商业模式想得更清楚，甚至短期的商业模式也要想得更清楚，不能让大家无限制使用，因为每一次交互都是要成本的。尤其是用GPT4做服务，虽然质量很好，但是成本确实高。

二是起步之后，考虑自身的竞争力。对于大部分的应用创业者来说，竞争力不来自于底层的大模型，但是也可以有一些模型竞争力。一般来说，我们在模型层的竞争力来自于三个方面：第一个是多模型，综合好几家的模型，显示能力多元化。第二个是选模型，在不同的场景下为用户选择最合适的模型，形成中间层的竞争力。第三个是自有模型，用专业数据为公司训练一个开源的模型，在明确的垂直场景下，使用开源模型，利用数据训练一个勉强达到GPT3.5水平的自有模型，并不是特别地困难。这部分对于大部分人而言，不是一件困难的事情，因此称不上特别核心的竞争力。

除了模型层之外，其实我们还需要专业的竞争力，主要来自于三个方面：第一个是品牌和流量。你的品牌和流量适合做什么AI，可以帮助你进行不对称竞争，为你创造优势。第二个是专业知识和数据。将专业数据和专业知识用于AI产品，会显现自己的独特性。第三个是有相关的系统，如果有一些相关的系统可以搭配使用，可以让AI效果得到充分发挥。比如在Office里搭配AI，用户很有可能在Office这种生态里用AI工具。值得思考的是，在原有的系统里面，有没有哪些是一套完整的系统，可以让AI效果充分发挥出来，找到自己的专业竞争力。

我们还需要交互竞争力，首先来自于容易上手，比如用Midjourney做PPT中的图，只有四个按钮，特别简单，在交互上没有SD那么丰富的操作，也没有那么深度的使用方法。正是因为容易上手，所以很有可能涉及到更广泛的人群。第二个交互竞争力来自于容易理解，比如Lensa和Midjourney相比，做头像更容易理解。最后交互竞争力来自于最佳实践，在交互里把行业里面的洞察和知识嵌入其中，它的竞争力就会更强一点。所以大家在思考交互竞争力的时候，尽量让它容易上手一点，容易理解一点，把行业里面的专业性融入到其中，竞争力也会更强一点。

对于创业公司来讲，想通过这三种竞争力树立壁垒，是比较难的。目前来看，有两种可能性，可以树立壁垒，加强行业内的竞争力。

第一个路径是网络效应，看你的产品里面能否设计出网络效应。即用得人越多，效果越好。如果你可以做到这一点，后来者哪怕跟你用一样的算法，基于一样的模型，用一样的交互界面，也追不上你。比如Character.AI这家公司，它增长非常快的一个原因是这个网站本身具备了网络效应。每一个人可以很快做出自己想要的机器人的样子，如设置动漫角色、说话方式。越来越多的人训练这些AI，这些模型就会做得越好，即Character会越好，会有越来越多的人跟它聊天，创作者也会精心地维护它。在它的生态里产生了网络效应，可以同时激活创作者跟消费者。Stable Diffusion是一个画图软件，并且是开源的。很多的第三方开发者会把自己的想法、工具做在Stable Diffusion上面，因为这个生态已经做起来了。基于这个生态，不需要从头开始做起，只需要不断放入插件，供用户使用，越来越多的插件也会让整个生态变得越好，用Stable Diffusion画出越来越好的作品，吸引越来越多的人。如果在上面做二次开发，再做一些创作，越来越多的人会基于这个进行创作，为它添砖加瓦，帮它做更多的插件。

第二个路径是数据的网络效应，即数据飞轮。比如用百度搜索关键词，联系最密切的链接会往上排列，总是跳过的链接会自动下沉，这样一来，使用百度的体验会越来越好，其实是用户在帮助百度训练它的模型。每一次看抖音的时候，也是在帮抖音做它的编辑，让它的算法越来越精确，越来越满足每个用户的需求。

这个时候，算法数据飞轮就会起来，意味着它的整体壁垒更有可能建立起来。飞轮一旦转起来了，别的行业是难以企及的。如果只是界面上的优势，很快就会被赶上。所以这才是真正的壁垒。

从整体上来看，大家可以考虑这三个方面。在定位上，最好的定位是我们在用户任务、AI能力和自身优势的交集处，把自己的产品放在这里。在产品上，从用户任务出发，设计合适的交互，把新能力用合适的方式展现出来。在商业上，第一是早点变现，早点考虑商业闭环，第二是在大模型之外考虑其他的竞争力，最后是要把飞轮建起来，可能是网络效应，也可能是数据飞轮。只有这样，才能够真正地抓住这一轮AI时代的商业机会。

研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大的机会1研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大的机会1

研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大机会！（三）研究了100个ChatGPT的真实案例，这或是我们一生遭遇的最大机会！（

最新内容