产品经理：一个商业 AIoT 智能硬件产品的完整拆解

时间：2022-12-29 23:00:00 智能电容器实物

— 写在前面 —

作者从2013年开始进入智能家居领域。近年来，他跌跌撞撞地掉了很多坑。一路上，几乎所有要解决的问题都找不到任何人来指导。他自己交学费。

本文的目标是解释一个完全涉及互联网行业上下游的产品，并努力通过尽可能少的文本来理解互联网产品各个领域的知识点。

笔者尽量在技术原理、行业知识、产品设计权衡这三个方面，不要太注重技术，但要避免表面知识，最基本的，会让读者了解如何开始未来准备涉及的相应领域。

—— 柯鼠

Now, let's make the cat out of the bag.

一、项目立项

(一)客户背景

来自中国台湾的客户希望成为一个智能语音机器人，并具有婴儿远程视频护理功能，标杆大陆的智能伴侣机器人和阿尔法蛋。

在客户质量方面，他积累了大量的联系人，与各种渠道建立了大量的合作，与台湾的一些酒店连锁集团建立了合作关系，养老院市场也有相关的渠道入口，未来的销售保证80K/Year...

客户支付了开案费。

(二)需求确认

由于业务合作内容的关系，客户最终要求支付 Turn-key 翻译的形式是:不管怎样，你最好按照我脑子里想的要求去做。

经过多次友好沟通，客户终于给出了需求文件:猜猜我想要什么&看设计吧.docx”

（三）自身经验

一般从零开始制作一套完整的互联网硬件产品，预期时间约为一年，但客户预期时间为6个月。

作为一家纯物联网云服务提供商，以前没有硬件和嵌入式开发经验，突然被要求为客户制作一套完整的硬件产品确实是一个巨大的挑战，此外，由于公司内部项目的安排，我只能虐待三个程序猿。

（四）Get the shit done

虽然公司的业务是云服务，但幸运的是，云系统从一开始就需要模块化设计，类似于流行的中间平台，内部代码是 CloudMeet 。模块化的优点是可以选择结合各种业务产品的云服务形式。

(五)关键问题

二、工业设计（ID）

(一)图像定位

产品定位为智能语音机器人，面向儿童教育市场，因此在产品形象上要考虑孩子的喜好，无非是几种：动物、卡通、人形机器人。

没钱买卡通形象IP，人形机器人太直男，最后选择动物形象：狗。

（二）产品需求确认

在设计方面，我找到了深圳设计公司A的老王，俗称王工；

初步面试沟通后，告知设计师产品批准的背景和目标；然后向王工提供正式的设计需求文件，解释产品设计定位、形象要求、外观设计要求等基本要素。

(三)初步设计稿

在确认需求后，王工开始进行设计，一般工期大概为一周。

常规设计公司合作模式，一般来说，设计合同提供三种不同的原型设计，然后让客户选择一个作为选择方案。

另外，便宜的设计公司会让高水平的设计师设计一份稿件，然后让实习生或初级设计师做两份 Bullshit 凑数，让顾客一眼就能产生快感。

总之，设计套路很深，多看不当真~

(4)第一次手板

选择设计方案后，需要与王工进一步沟通，细化调整，包括整体尺寸和配色调整。细节调整完成后，将开始安排制作手板。

手板是指验证模型，纯塑料模型制作产品设计，确认实际效果。

CNC雕刻和喷油可以得到非常漂亮的纹理

这部分是手板厂的程工，王工为程工提供了设计文件，手板类型选择了程工说的最漂亮的CNC雕刻。

(五)直男白中国红

手板出来后，和同事左看右看，怎么看，怎么看。

为了体现设计满足市场目标客户的需求，她特意请咖啡店老板娘用手板欣赏。她有一个六岁的孩子，一个典型的目标客户。

一开始，我激情地谈到了产品的设计创意和市场目标，最后，在口水多于咖啡的交流过程中得出结论：直男设计。

值得反思的是，毕竟连女生的手都没牵过，母婴市场的产品设计原则应该是情有可原的。

因此，我做了作业，研究了市场上儿童智能设备的外观设计比例和配色特点。人类在视觉上对可爱的感觉有一些关键特征。

比如：动漫的角色大都具有大眼睛大脑袋短身子，人类婴儿也有类似的特征。

电影《神偷爸爸》的剧照来源于网络

据估计，不按这种图纸比例出生的婴儿在古代很容易被成年人撒上孜然烘烤，不利于物种繁殖。

(六)比例调整

设定新的设计方向后，麻烦王工通宵加班修改。

< style="text-align:justify;">首先是比例调整，这次没有再选CNC，而是选择了3D打印。

3D打印

对于外观及颜色的初步验证来说，这已经足够，关键是制作周期要短很多（便宜）。

（七）颜色调整

颜色部分遇到了一个问题，就是颜色的具体定义。我们重新选定了淡蓝色和淡粉色两个配色标准，但这两个描述对于设计师而言，就跟我描述女生的口红色号一样：不是姨妈红就是牛屎绿。

尝试在网上找色盘去选定色值参数，而王工进行上色设计后，怎么看都不对。反复折腾了王工之后终于还是办法比问题多：直接从网上买了一对杯子。

这两只杯子刚好一粉一蓝，而且颜色符合要求，王工直接对着杯子参考。

（八）关键性问题

三、结构设计（MD)

（一）设计需求

ID设计确认之后，下个阶段便是产品内部结构设计，这部分找的是深圳另一家设计公司B的刘工。

常规来说一般ID和MD都会选择同一家公司设计，一方面合并费用低一些，另一方面减少沟通成本。

不过由于一些原因，我最终将ID和MD设计分开，所以这阶段会再次产生设计需求的确认工作。

外观部分，ID工程师提供设计的渲染图及对应尺寸标注文件，并注明外观颜色要求；结构部分，电子工程师提供电子结构空间设计要求文档，告知所选用的关键电子元器件尺寸及散热、布局和避空要求。

（二）首次结构设计

因为整体结构比较大，发挥空间充足，所以首次结构并不需要考虑太多元器件冲突问题。

在ID确定之后，修改MD部分的时候一般由于实际的空间摆放、器件避空等要求，外观都会有调整，这部分由于刘工也做过ID，就一并修改了。

结构设计工作完成就可以进行3D打印做手板，用以确认外观变动、结构实际状况。一般首次结构实物确认都是体现设计问题，比如螺丝柱遗漏、按键骨架脆弱等。

（三）初版结构确认

在调整结构设计问题之后，再进行3D打印的手板制作，经实物确认即可作为初版的结构定型。

下一步刘工会向电子工程师提供版框图，电子工程师根据结构调整原理图及元器件选用，进行后续的电路Layout，电路部分样品制作完成将与结构进行配合验证。

（四）0.618

在第一次拿到电路板正式与外壳手板进行组装之后，总还是觉得外观有所欠缺。

改！！！

首先是耳朵，感觉上有点偏大，然后按一个毫米的幅度反复调整了两三个版本，尾巴也为了卡哇伊缩短为柯基版本。而最麻烦的是身体比例，为了头部与身体的视觉协调，反复拜托刘工进行微调，以希望头身比例尽可能逼近黄金分割比。

在刘工电脑旁站久了之后，竟然发现他的光头还挺可爱的，不知道他还有头发的时候会是什么样子~

（五）MIC位置确定

1.单 MIC

产品的麦克风主要作用的机器人唤醒（类似“喂，Siri”）、AI对讲和远程双向通话，物理上要考虑拾音、回声的问题。

一开始结构设计上考虑的是单MIC设计，这种情况下拾音效果最佳的位置是正对用户，在ID设计初期MIC开孔放在了机器人正面嘴巴的位置。

单MIC位置

2.MIC 阵列

ID阶段制作了手板发现不大美观，所以在MD设计时就放在了铃铛的位置。感觉美观问题总算是解决了客户又提了个小需求：预留双MIC阵列，提升拾音和回音消除效果。

这个小需求怎么说呢，反正，客户是上帝。于是跑去咨询一个音频算法大牛，彭工。大牛表示要想实现双MIC阵列，在开孔的物理设计上有严格的要求，这会直接关系到拾音的能力、回音消除的效果。

贿赂了两包黄鹤楼之后，刘工终于又修改了结构，两个MIC的位置最终被放置在了机器人顶部。

MIC阵列位置

（六）声音系统

放音喇叭的设计是一套比较系统的工程，牵涉的部分也比较多，关系到：共振、MIC输入干涉、放音品质、设备重心等一系列考量。

正常来说，为避免SPK放出的声音影响到MIC的输入，喇叭在设计要尽量远离麦克风并且最好呈背对形式。比如360小水滴、萤石C2W两种智能摄像头的设计。

1.SPK位置

单MIC正前方设计时，喇叭在机身后的位置影响不大，因为彼此是背对的。

但双MIC布局在脑袋顶部之后，就会发现喇叭和麦克风已经不能背对设计了，那么SPK就要考虑尽量远离MIC。

最开始考虑的是放在机身背部下方，刘工修改了之后看效果图还是觉得比较丑。再往上摆，处于脑袋正下方，但由于形状冲突（弧面过小），最终只能选择在脑袋正后方。

2.SPK选型

在测试声音播放品质过程中，遇到了不少问题。

首先是喇叭的选型，外磁的喇叭价格比较便宜但是重量大，内磁的喇叭轻一些但是价格高。

由于喇叭位置在脑袋正后方，重心靠外，所以为尽量平衡产品的重心问题，选用了一个内磁喇叭，然而音质测试并不理想。

在测试声音播放品质时，发现不管更换任何测试音频，都有一种声音被闷住无法输出的感觉。

在更换了三四个供应商提供的喇叭还是不满意之后，直接从阿里巴巴上找了十几家喇叭厂商，逐一购买了内磁、外磁的各型喇叭数十个。

在各种喇叭快装满一抽屉之后，想到了从喇叭开孔问题。因为不管换了多少种喇叭，声音都处于闷住状态，直接把喇叭开孔全部砸开就没问题，所以只能拜托刘工再从喇叭开孔入手。

3.开孔设计

在物理上，喇叭的开孔并不是随意而为之，而是有既定的开孔公式进行换算。一开始我们打算单纯增加开孔数量，但是过多的开孔数量会导致孔径变小，这会影响后续的模具问题。

权衡之下，只能尝试在小量增加开孔数量的同时，更改开孔排列形状，然后把几个不同形状的喇叭开孔打了手板进行验证之后，但仍是差强人意。

这要上升到玄学的范畴了。

从结构设计师、喇叭供应商、电子工程师都已经无法理解到底是什么原因导致了声音无法出来。看着刘工怨念的眼神，我突然想到为何不能仿造别家产品的喇叭开孔？

于是立即下单买了个小米的米兔，带着一包玉溪又拜托刘工比对米兔的开孔设计修改了一次——声音终于是肯出来了，最后为了音质，还是选定了一个外磁的喇叭。

4.后音腔

声音能出来之后，虽然音质满意，但是洪量度不够，又双叒叕请刘工再调整设计，增加了后音腔。

但手板打出来之后测试发现没啥帮助，加上客户考虑到增加的模具费用，最终并未使用后音腔设计，但预留了装配空间。

5.刘工疯了

鲁迅有讲，“人类的悲欢并不相通” ，深以为然。

坦白来说，我的确不大知道在修改了26次结构设计之后，刘工心里在想着什么。

在雕刻一件艺术品？正在打造一款东半球最棒的智能机器人？不过看起来当时他手里那把40米的大砍刀似乎是从瑞士买的。

（七）最终设计

（八）关键性问题

四、模具设计

（一）设计资料

在结构部分确认之后，刘工将提供ID文件和MD文件给到模具厂的老陈，王工再将外观设计要求文档一并给到老陈。

老陈是模具厂的老板，工程出身。虽然是做技术的，但是实际上是个表面人畜无害，内心猥琐巴拉的老实人。一般模具报价、生产报价、工期都是老陈直接给出，

这次项目由于是Turn-key所以模具报价方面需要代客户沟通。虽然其内心猥琐，但是要在报价上拗过老陈却不是件容易的事。

羊毛不可能出在猪身上

（二）砍价

制造业这行做的多半是酒桌生意，但老陈一向不喜欢应酬，他觉得毕竟请客户吃饭最终也是羊毛出在羊身上，不实在。

我也不喜欢应酬吃喝，一方面毕业几年因为工作的缘故胖成了工伤，另一方面由于家族遗传缺乏乙醇分解酶，基本三瓶青岛就会倒。

但这次老陈带了个业务妹子一起吃饭。

一阵酒桌公式化寒暄客套之后，

我便掉入了陷阱——光顾着跟模具厂老板聊人生谈理想不知不觉就喝掉了12罐百威。

推杯换盏之后老陈长什么样已不大记得，代驾回来在平峦山脚的社区医院门口地板直接就躺下了。

睡不着，滚不动，光想着漂亮女鬼。

直到一个多小时后，被Talan叉起了身子，镀着月光回去。

（三）开模

三天后老陈的报价少了四万块，这边千恩万谢兄弟兄弟之后，便是付款开模。

一般开模时间取决于模具复杂度和大小，这次包括购买钢材和设计模具在内时间大约在45天。

这玩意大概长成下面这样：

（四）试模

模具制作完成，模具厂会先购买原料通过注塑机（啤机）试产小数量成品进行验证，包括外观、结构、颜色相关问题。

1.触控键

机器人头顶设计有一个触控按键，这个按键需要通过铜皮利用电容效应进行触发，为避免电路触发不够灵敏，所以在铜皮贴合位置的壳子部分进行了减胶做薄处理。

由于在壳子上挖了个正方形的矩形坑，导致生产时带来了缩水的问题，最后解决的办法是将矩形坑做圆角处理，减轻注胶冷却时各区域收缩不一致问题。

2.电池仓

机器人支持电池使用模式，为追求终端用户体验设计选用了两颗18650电池组，就是特斯拉上的那种。

这种类型锂电池有较好的稳定性，但是缺点是偏重。固定电池的电池仓一开始设计的是两条腿固定，但是实际组装后进行摔落测试发现很容易出现断腿事件，讨论之后只能增加腿的数量到四条，改结构。

3.耳朵硬度

耳朵一开始为了小朋友摸起来舒服，将硬度设计得很低，这使得耳朵稍微使劲一拽就掉了。

让模厂调整材料，变成硬质形式，又导致机器人很不扛摔，多次修改尝试之后，最终选定了一个材料硬度系数在保证不被抠出来的同时又让耳朵尽量柔软。

4.颜色校正

外观颜色方面，虽然ID给了详细的数值，但是实际生产出来的效果仍然还是有细微差距，因为色粉的值并不是完全跟计算机图示效果一致，所以最终把王工手里的两个杯子给拿到了模厂进行比对配色。

（五）定型

1.签样

再多次试模之后，便最终确定模具的设计及生产要求，外壳部分模具厂生产工程师陈小姐，会出具一份纸质承认书及对应壳子样品，进行签字。

2.验收标准

而生产部分，我这边会根据讨论，出具一份成品验收标准书给到品质工程师李工，由模具厂、组装工厂、客户（PM）三方进行确认，其中关键的部分是外观检查标准卡。

因为外壳越大，产生色点和污染的概率越大，外观检查卡用以测定外观污点的尺寸，需要指定一个多方可接受的标准。

五、硬件开发

（一）规格确认

电子部分由东莞一家OEM厂进行配合，电路设计交由该厂的张工负责。

张工是河南人，每次看到网上有井盖出现他都要义愤填膺一番，天天把戒烟戒酒挂在嘴边，但身体从来都很诚实。

在张工开始设计之前，我需要先编写产品电子规格文档交给张工，除了产品的功能描述和市场定位，还包括摄像头参数、点阵参数、电池容量、耳朵颜色等。

（二）设计资料确认

产品电子规格确认之后，需要组织CPU原厂、嵌入式工程师、电子设计工程师进行讨论，原厂的工程师会告知嵌入式系统的一些特性及电路设计上的要求。

工程师之间的沟通往往比较质朴，闷头讲完画几个白板就是各自留邮箱和微信了，该阶段原厂这边会将电路设计用到的芯片资料和原理图资料发出来。

（三）EVT阶段

Engineering Verification Test，该阶段设计纯粹验证电路原理设计及Layout的设计。

1.硬件设计

张工拿到原厂给的资料首先会进行的是电路原理设计。

该阶段硬件第一步目标首先要进行验证性研发，既完整产品涉及到的所有硬件功能节点都设计到一块电路板上，主要用于原理设计及元器件选型的可行性验证。

原理图设计完成张工会将设计文件发回给原厂，原厂的硬件工程师Evans会进行原理图的设计review，以保证张工的原理设计是符合芯片技术要求。

原理图修正并确认后，既可进行PCB Layout设计，将元器件布局到电路上。

2.洗板

所有设计经过确认之后，便可以交由洗板厂进行PCB洗板，洗板所花费的时间会受到PCB层数的影响，比如从二层板、四层板、六层板所需要的洗板时间会以此增加，费用也会更贵，当然对于硬件性能来说也会更好些。

3.SMT

PCB洗板完成，物料备齐之后便是上机贴片（SMT）。

SMT是表面贴装技术Surface Mounted Technology的缩写，SMT贴片指的是在PCB基础上进行加工的系列工艺流程的简称。

电路板通过钢网刷上锡膏之后，由高速贴片机(SMT)将相应元器件贴合至电路板上，该步骤得出的结果便是PCBA。

这是机器的样子

4.组装

将外围器件，比如MIC、SPK、电池等相关器件，通过相应电子连线串接至PCBA上，便可得到一个完整的硬件设备，由于处于EVT阶段，硬件设计与结构无相关性，所以这里组装并不涉及外壳。

5.测试

该阶段硬件测试主要是电路的工作测试，比如上电之后CPU是否能正常点亮，各种模块的电流、电压是否正确等等。对于问题的修正，一般用飞线的形式进行操作验证。

所有的元器件都集合到一个板子

（四）DVT阶段

Design Verification Test，该阶段修正EVT阶段的电路原理设计，并根据外壳结构进行Layout验证。

1.设计

在EVT阶段验证通过之后，便可以进行下一阶段的DVT设计。

张工根据EVT的测试结果，重新修正原理图设计并发给原厂review，并根据从设计公司B的刘工那给出的结构版框图重新进行layout，将元器件按正式的外壳结构进行布局。

2.结构验证

该阶段板子洗完并贴片后，即可与初版的外壳手板进行匹配验证。包括电路板与螺丝柱契合是否正确，结构与板型对于生产方面的简易程度、抗摔性等。外壳结构及电路布局设计都会进行微调以实现两者锲合度最佳化。

3.软硬件功能配合开发

电路设计的经过EVT的验证，在DVT阶段修改了layout之后，则开始配合嵌入式、单片机程序进行验证。

单片机、嵌入式程度，对于电路硬件的验证会进行反复调整修正，以确定硬件设计是符合软件要求。同时OEM工厂会与天线工厂完成天线的位置测定。

这个阶段是整个项目开发的主要工作，基本会占到整个项目开发时间的65%，硬件、嵌入式、单片机会在这个阶段完成到可试产状态。

（五）NCC认证

1.目的

类似于大陆市场的消费类电子产品需要做3C认证，台湾市场的监管要求电子产品需要做NCC认证。

对于本产品的认证测试包括：

A.大于1GHz高频的EMC测试，主要是WiFi模块。

B.低于1GHz低频的EMC测试，其他普通元器件。

C.传导发射（Conducted Emission）测试，通常也会被称为骚扰电压测试，主要是测试连接适配器时对供电系统的影响。

D.静电测试

2.高频EMC

这里的高频是指大于1GHz的电磁辐射测试，设备中主要是WiFi模块会涉及这个部分测试。

A. WiFi定频

在开始之前首先要对WiFi模块进行定频。这个部分是由WiFi模组厂进行协助处理，负责对接的是彭工。

我们将完整设备带到实验室，彭工首先进行WiFi功率测定，将模块的工作功率设定至合理水平，然后将WiFi工作频率和通道进行限定测试，通过之后会给出相应的操作指令文档。

B.辐射测试

这个部分我们找了深圳的一家测试实验室A，对方的测试工程师是个萌妹子，但她强烈要求我称她为温大侠。

设备的辐射测试需要将设备放到一个巨大的屏蔽房，然后将设备调整到正常运行状态，再测定各频率波段的辐射情况。

屏蔽房

由于电路在设计之初就考虑到了过认证测试的情况，所以预留了相应设计用于进行屏蔽修改，对于需要增加屏蔽的部分焊上相应参数的磁珠即可。

过程不大顺利，虽然焊磁珠解决了部分问题，但是测试几次都仍然有不能通过的部分。而WiFi的定频测试比较顺利，设定几个频率接入测试设备后都通过了。

3.低频EMC

在测试实验室A多次修改之后，低频部分都测试不过，需要进行详细的整改。考虑到每个小时高达700软妹币的整改费用，于是我们靠友谊的友谊的友谊找到了另一家测试实验室B。

测试实验室B

靠脸皮的关系拜托了梁工加班整改，在尝试了调整摄像头驱动等级，给电路板增加磁珠，给连接线增加磁环等各种方式后，对辐射波形进行读点操作终于符合了认证要求。

4.传导发射

传导发射（Conducted Emission）测试，通常也会被称为骚扰电压测试，主要是测试连接适配器时对供电系统的影响。这部分也是在测试实验室A完成的，相对比较走运测试一次既通过了。

5.静电测试（ESD）

Electro-Static discharge，在用户操作设备的过程中，有可能会因为自身的静电而击伤电路元器件，所以还需要对设备进行静电测试并作出整改以符合标准。

6.领证

在所有的测试都通过之后，实验室A、实验室B都会分别出具相应的整改报告给到OEM厂，由张工根据整改报告将设备进行整改之后，便可以将设备寄送至台湾NCC认证机构进行测试审核，通过之后便可颁发相应证书。

（六）PVT

在DVT及NCC通过之后，便可以进行试产。

Process Verification Test，该阶段的目的：一方面是开始向客户交付测试样机检验功能及稳定性，一方面是开始为批量生产的流程确定标准。

1.签样

在NCC整改确认之后，量产之前OEM厂首先会要求在生产之前进行电路板的签样，以确定原理设计、layout、BOM符合客户要求。

客户签字既锁定版本，OEM厂将以签样标准进行后续生产，如果由于市场原因需要更换物料，则要通知客户确认并重新进行测试签样。该部分签样由OEM厂的生产工程师李工负责对接。

2.最终设计

（七）关键性问题

六、嵌入式系统

（一）需求确认

在确认完硬件完整规格后，我这边还需要设计一份系统功能规格文档，用来给嵌入式开发的Danny和单片机开发的Talan，并且需要开个小会面谈功能以确认功能的理解。

（二）原厂SDK验证

从CPU原厂会拿到三样资料：SDK文件、开发资料文档、evb开发板。

为确保后续开发不引入已知问题，Danny首先在开发板上进行SDK的功能验证，以确保原厂的SDK能正确工作。

（三）协议及规格定制

在正式开发之前，与开发确认完系统功能规格后，为减轻开发的工作量，我还需要定制通信的报文协议及表情、提示音内容。

1.设备与APP交互指令

该协议用于设备和APP之间进行交互控制，比如查看电量、控制静音等等。

CloudMeet平台本身支持为各种类型的设备提供服务，此前为方便各种厂商设备接入我已经定制了一个通用的协议表，而机器人由于是新增设备，所以还需要增加一些协议，比如儿童锁、睡眠之类的控制。

协议内容采用JSON格式，支持 HTTP 和 TCP 两种通信类型。

2.单片机与SoC交互协议

SoC处理的功能与单片机不同，所以两者之间也需要进行通信交互。

由于两者走的是 UART串口，所以需要自己定义协议。这里我们基于16进制定义了报文头和数据段及报文长度。

3.表情规格书

设备的表情由两组8x8 LED阵列进行控制，由 0/1 定义每颗LED灯的亮灭，再逐列进行点亮控制。

由于表情的IC连接在单片机的引脚上，所以表情的执行都通过单片机，我需要将表情的二进制数据设计出来并转化为单片机可执行的16进制数组。

编号：ID 001 ；含义：笑脸；场景：功能规格书指定；方式：逐列扫描

4.提示音规格书

机器人的各项操作都会伴随一些提示音，而这些提示音的编号及音频内容都要定义清楚，并由系统功能规格文档指定调用场景。

（四）嵌入式开发

嵌入式开发部分主要是基于Embedded Linux做开发，一些需求快速启动的产品则多半基于RTOS系统，前者是分时操作系统，后者是实时操作系统。

RTOS硬件资源占比小很多，但是开发上限制也很多。Embedded Linux资源占比较大，但是开发难度要低许多，该部分由Danny开发为主。

在正式开发之前Danny会先编写嵌入式功能设计技术文档，用以定义嵌入式的技术内容，以便未来其他人维护及开发，这会比代码写注释还要重要。

1.联网模块

该模块主要是解决设备的配网功能，首先通过APP将配网用的WiFi信息生成二维码，然后设备端调用摄像头采集图像并将二维码解码得出对应的WiFi信息。联网程序得到相关WiFi资料后执行联网操作，成功之后再将认证信息提交至CloudMeet系统。

2.回音消除

回音消除功能(Acoustic Echo Cancellation,AEC)，作用是避免喇叭播放出来的声音又经过麦克风录制到系统，形成回声。该功能模块需要电路设计配合，即硬回采设计。

Codec模块将声音采集电路传入的音频提交到系统，系统再通过相应的AEC算法进行回声消除，从而得到单一的原始播放声音。这部分由SoC原厂的Kason配合算法部分开发。

3.唤醒模块

唤醒，也叫做“热词”，类似iPhone“喂，Siri”。这个用以设备待机时唤醒设备或者设备执行其他动作时进行打断。

程序首选会进行VAD监测，发现有说话声音后再进入通过ASR进行热词识别，比如模型设定的是“啊猫啊猫”，你叫“啊狗啊狗”设备就不会鸟你。热词唤醒之后才会提交到云端AI进行处理。

4.NLP模块

AI模块主要是自然语言处理，既NLP。在热词唤醒之后将用户输入音频提交至AI云端，进行语音识别，云端再回复相关内容至设备或执行相应动作。

5.点播模块

点播模块的作用是用户从APP端H5页面点播内容时，经由CM IoT服务推送至设备端进行播放。

6.播放模块

设备所有的声音、音频内容都是由播放模块进行处理。由于客户要求较高，需要设备直接播放YouTube连接内容，Danny这边直接用FFmpeg移植到设备端，并进行二次开发。

7.音视频模块

视频通话这块，因为之前在PC和移动端做过Webrtc，所以一开始曾经考虑将Webrtc移植到嵌入式端。多番讨论后觉得移植成本过大，最终选择了使用P2P通信，走的是RTSP协议。

8.云存储模块

产品的定位是儿童智能教育+家长看护，所以带有摄像头功能。而CloudMeet本身具有视频云存储服务，所以一开始我们根据需求给客户开发了视频云存储功能，走RTMP协议。

BUT，测试通过后客户想想不对劲，一个儿童故事机为啥需要云存储功能？最后还是取消了，对此Danny只是嘴角微微上扬了一下……

9.智能控制

用以控制IoT设备，比如用户唤醒设备后，说出指令：帮我打开窗帘。则机器人会自动发出指令让窗帘自动打开。

10.按键模块

设备的按键部分由于涉及到电路的控制，由Talan进行处理，从驱动层捕获到按键事件后直接通知Danny的应用层进行处理。

11.OTA模块

OTA则是系统固件更新，这个要麻烦不少。根据我之前设定的交互指令，需要先App先从CloudMeet OTA服务处查询可用更新，再将更新信息和指令发送至设备端，设备端验证通过后再将固件下载到设备端，设备再重新系统进入内存模式进行更新系统。

（五）单片机(MCU)开发

单片机相对SoC要低阶很多，但是好处是便宜还能待机，所以一些开关操作都会交给单片机进行处理。这个部分由Talan负责，同时开始之前会先编写一份单片机设计技术文档。

1.开关机控制

为了美观，设备开关机按键没有使用早期设计的直接控制通断的分立元件，既拨动开关形式，而通过单片机监控。

也就是：关机模式时，用户长按Power键，触发单片机监测进入计时器，到达预定时长后控制电源模块给SoC上电，Linux系统进行启动，反之亦然。

机器人开关

2.电池管理

电池的充放电管理由硬件控制，但是电流检测及充电状态则由单片机执行，再将结果通信给SoC。

3.表情模块

根据系统功能规格书，具体到每个行为都会有对应的一个表情，这些表情都通过表情规格书进行编码。

（六）测试文档

功能开发完成后，需要根据功能规格文档编写测试文档进行测试。测试方式是按照一般的操作流程写出预期的正确结果和错误结果，然后完成跑一遍文档的流程以验证测试结果是否符合功能设计预期。

（七）关键性问题

七、云端系统

（一）CloudMeet

本云端系统在设计的定位上是一种模块化设计，类似现在流行的中台设计。该种设计的特点是：所有的模块都是解耦的，而选用不同功能模块则可以组成不同的云端服务能力。

对于智能机器人产品而言，则是从CloudMeet的模块中挑选出需要的服务，部分欠缺的细节功能再补充开发即可。机器人新增的服务功能部分由Jack负责，流程依然是先提供需求文档然后开发，最后测试验收。

（二）AI系统

一个完整的AI对话系统大致包含四大模块：ASR、STT、NLP、TTS。

1.ASR（Automatic Speech Recognition）

语音识别，一般简称ASR，其作用是将声音转换为文字的过程。对于机器人而言，语音识别的主要应用方式是远场语音识别（Farfield Voice Recognition），这里我们选用了苏州的一家语音服务商，这部分由苏州的语音服务厂商刘工配合，该服务包含两个主要模块。

（1）语音激活检测（VAD）

Voice Active Detection，主要作用是在麦克风持续工作并输入音频的过程中，检测何时才是发生有效的声音输入，识别并消除长时间的静音期。

（2）语音唤醒（KWS）

Keyword Spotting，当输入的声音经过VAD处理后，进行语音识别。该识别会判断是否包含用户输入的语音中是否包含关键字，该关键字可认为是机器人设备的“名字”，例如iPhone的“Siri”、亚马逊Echo的“Alexa”等。如果检测语音中包含该关键字，则将设备唤醒。

2.STT( Speech to Text)

语音识别的一种应用类型，将音频转换成文字。这部分我们仍然选用了苏州的服务商。

3.NLP(Natural Language Processing)

自然语音处理，通俗的解释就是理解用户到底在说什么。

用户输入的语音通过STT识别为文字时，系统是无法理解内容阐述的是什么，需要进行语义理解，分析出对话所要表达的内容，然后才能安排下一步的回应动作，比如问答形式回复用户，或者是指令相关控制性指令。

因为目标是台湾市场，所以我们选择了一家台湾的AI服务商，这部分由台湾的AI服务商Nick配合。

4.TTS（Text to Speech）

在NLP系统理解了用户的对话后，需要作出对话回复，该回复一般是即时文字内容生成，对于设备端而言需要播放的是音频，所以需要预先将回复的内容转换为音频再进行进行播放。

一开始用的也是跟STT相同的苏州服务商，但是对方不具备台湾腔的语调。最后我们选用了KDXF的TTS服务，以实现台湾腔调的音频。

5.完整时序图

（三）AIoT系统

客户的诉求之一是需要通过语音交互实现物联网设备的控制，由于我们之前就有IoT的服务，所以在系统设计上并无太多难度。

最终实现的场景为：用户通过语音给设备下指令，设备将语音提交至AI系统处理，解析出用户操作指令后调用CM的IoT服务，再由MQTT协议推送至物理设备端以实现交互控制。

比如用户唤醒设备后，下达语音指令：帮我打开电视。机器人收到指令后将命令提交到云端，然后再通过云端控制打开电视机。

（四）关键性问题

八、APP客户端

（一）UI设计需求

1.功能需求文档

与Jennifer的沟通界面首先要提供一个功能需求文档，并告知产品的市场定位、目标受众、同类型产品参考等。

2.原型设计

根据设计师配合的形式各异，有些设计师仅处理UI部分，不做UX部分设计，这种情况需要PM提供原型设计，我一般会用Axure。

由于项目工期紧张，为节约时间这里Jennifer会囊括UX的设计，所以这次我并不需要再提供原型。

（二）交互要求

交互部分我一般会有两个基本的设计要求，分别是目标路径、目标成本。

1.目标路径

所谓目标路径既用户到达其目标的路径。举个例子，对比微信在iOS和原生Android两个系统下启用微信“位置权限”的设定的典型操作。

工程师思维与用户交互思维往往会相左。工程师会希望保证工程（功能）的整洁性而倾向对功能模块进行收纳、归类、分组，但是这会导致用户操作的目标路径变深变长。

而用户永远追求“一眼就看到”的使用需求，操作路径越短越好，但是这对交互设计而言又会使得功能模块过度扁平化形成层次逻辑混乱的焦虑。

但就交互设计的目标而言，永远都是尽可能缩短目标路径。

2.目标成本

所谓目标成本，是指在用户在目标路径上操作时间成本的数学期望。

做个假设：微信在未来除了提供普通群聊，还提供更高一级的高级群聊，则目标路径深度分别如下：

我们假定微信所有的群创建类型都符合幂律分布，选取普通群:高级群=8:2，微信的每一步操作成本计量值为10，则得出目标成本计算公式：

由此可见在不同的设计情况下，应用到用户实际场景中会带来不同的目标成本预期。

所以在设计上，我们希望通过改变用户的交互形式来使得这个成本尽量变小。

（三）APP配色风格

1.暖色调

由于产品的目标人群是儿童，而APP的目标人群是父母，所以APP的配色风格一开始优先考虑的是暖色调。

我们参考MIUI的设计情景，为了追求暖色调而大量使用橙色、黄色、红色这些配色，用户初期视觉接触感很好，用久了之后却会形成视觉压力从而造成使用者的视觉疲劳。

2.安全色

如果花点时间去研究下，我们会发现Facebook、WhatsApp、支付宝、App Store、饿了么、Safari，这些巨型应用的ICON或界面主色调多为蓝色/淡蓝色。而根据调查数据显示，大多数人都喜欢蓝色。在全球范围内来讲，蓝色也是最安全的颜色。

（四）视觉稿件

在确认完设计的相关要求并沟通清楚功能需求后，Jennifer便可开始进行设计。

初版设计完成后会先输出视觉稿件，用以确认功能、配色、交互上是符合预期的。

（五）UI FLOW

视觉稿件经多次修改确认后，在正式输出设计文件之前，先要输出UI FLOW，这是一个完整的交互流程图，除了部分细节弹窗提示，绝大部分的界面跳转都会体现出来。

该设计的输出一方面方便设计师自我检查，也方便PM进行二次交互设计确认，最后也需要给到工程师以便于了解完整设计。

（六）UI文件输出

1.标注文件

在正式切图输出之前，需要对界面设计进行标注，包括元素的宽高、色值、字体等。

2.切图文件

根据Android系统、iOS系统的规格要求，切图并输出对应分辨率要求的设计元素图片。

（七）App功能需求确认

1.需求可行性确认

在功能需求文档设计完毕，首先会跟APP开发讨论，Jack和Talan会根据功能需求，告知功能是否可实现及实现的成本。

PM需要再进行功能取舍，一个被揍比较少的PM，都会尽量少提“APP主题颜色要跟随手机壳颜色变化”之类的需求。

2.设计可行性确认

正所谓“UI动动手，RD跑断腿”，设计师很多时候会为了追求交互、视觉体验，设计各种酷炫的交互效果，而不顾开发成本。

PM就需要在UI和RD之间的诉求做权衡。所以在跟UI讨论设计方向的初期，就会把UI的设计设想反馈给RD进行可行性确认。

3.功能规格

需求及设计可行性确认后，将功能需求细化为规格文档，定义出输入边界、操作粒度等细节。

（八）开发

正式开发之前先由Jack编写APP功能设计技术文档，文档用以描述技术开发内容定义，用以iOS和Android进行规格统一。

1.账户系统

用户用以注册登录账号的功能，一开始给客户提供了全球手机号+邮件地址的账号体系，不过后面客户去掉了邮件地址。

2.点播功能

该功能具体是在APP嵌套一个H5页面，该页面由AI服务商提供，主要是媒体内容，故事、英语、儿歌之类。点击之后由AI服务商的内容服务端向CloudMeet服务端发起请求然后推送至设备进行播放。

3.看护功能

该功能既是视频监控功能，叫做baby monitor。用户可在APP上远程查看设备的摄像头内容，并且支持双向音频对讲。

4.设备管理

该功能包括设备配网、添加设备、设备分享、远程控制、OTA升级等功能。

5.群聊功能

由于机器人具有家庭看护的功能，所以客户要求有一个设备与多个APP端群聊的功能，方便孩子与父母亲进行对话。这部分实际上是IM的功能，消息要支持音频和文字两种。

APP端发出的文字消息则需要经过TTS进行转换才发送至设备。因为以前开发设计过社交软件，这部分并未使用第三方IM服务商，直接由CloudMeet服务解决。

6.个人设置

个人设置包括一些个人昵称、账号等相关信息。

7.拨打电话

如果APP端的用户设置了昵称，比如“爸爸”，则机器人被语音呼叫“打电话给爸爸”时，APP端会响起来电，点击接听即可实现APP与设备视频端通话。

（九）测试

APP开发完整需要编写APP测试文档，测试验证功能开发是否正确符合设计需求。在APP上架之前，Android通过APK包形式进行安装测试，iOS则通过TestFlight进行测试。

（十）上架

App Store的上架比较麻烦，提交上架时需要同时准备账号和设备，以便审核人员进行远程测试验证。Google Play 的上架则要容易一些。

而国内的Android市场则需要在上架时提交软件著作权登记证书，这需要提前40天左右准备好。

（十一）关键性问题

九、官网&控制台

（一）官网

客户的官网比较简单，一个WEB前端页面，包含大屏banner轮播、产品简介等基本内容，并无发布新闻、登录操作等相关后端开发。

1.需求确认

首先跟客户确认要展示的内容，希望的设计以及对应的文字内容及风格确认等。

2.UI设计

将客户需求整理并告知Jennifer，然后进行设计切图。

3.开发

由于页面简单，得到切图文件后，Jack使用Bootstrap框架简单为客户开发了一个官网。需要特别声明的是，logo和banner并不属于我的品位。

（二）控制台

1.SN号管理

SN号为设备的唯一标示，作为云端服务器识别设备身份是否合法的关键信息，CloudMeet后台提供了该管理功能，包括新SN号导入、删除等。

2.设备追踪

锐单商城拥有海量元器件数据手册、IC替代型号，打造电子元器件IC百科大全！

产品经理：一个商业 AIoT 智能硬件产品的完整拆解

相关文章