深入浅出 微处理器大师分享IC设计经验

来源:电子工程世界 作者:—— 时间:2010-06-17 09:51

4、那么Tensilica是如何来克服在功耗上的挑战的?和竞争对手比起来又有何区别?

      ChrisRowen:举个例子。Tensilica赞同为特定的任务去优化处理器。优化流水线(Pipeline),优化接口,优化设计层面,然后把多个内核放在一起,以建立一个多核系统。这种优化的能力将产生巨大的影响。我会在今天下午的会上谈到这个称作Turbo解码器的专用(Specialized)处理器。Turbo是一种特殊的算法,可以从嘈杂的噪声中提取有用信息,在一个工作循环(cycle)内,这个解码器可以执行大约3万次,哦对的没错3万次RISK指令。是的,通用的压缩(Compression)处理器只能执行一次指令,而这个专用处理器可以执行3万次。当然这是一个极端的例子,只是想表明当你知道你的问题在哪里,你就可以做出很多令人难以置信的事情。并行,并因此难以置信的高效率。

      同样的原则可以适用于各个层面,适用于各种其他门类的专用DSP、无线接收器,适用于基带和音频的通用DSP,也适用于客户意欲进行视频处理或其他图形压缩、安全操作、网络协议处理,以及广泛应用于射频的深嵌入式控制(DeeplyEmbeddedControl)。

      Tensilica特别集中精力于那些能够专门优化的能力,以及真正方便使用多核的能力。而因此,我们从那些传统的CPU老家伙们中区别了出来。譬如Intel、ARM、MIPS,或者其他什么人。他们都面临一个相同的物理问题,摩尔定律在给了他们更多的晶体管之后,却没有给他们更好的功率控制,对不对?

      他们很少去考虑并行的问题。而与之相反,我们在应用层面非常努力地工作,以期寻找到解决方案。在云计算那段,我们确实可以将任务分割成很多子任务,但是当我在这里玩游戏(Chris又一次拿起手里iPhone开始演示),我真的被限制了。你看,一个手指只能玩一样东西哈。因此在应用处理器的层面,你真的无法得到啥好处。MIPS、ARM,甚至还有Intel,都面对着这样一个无法在当前硅科技下有效完成多任务的问题。而那是我们擅长的。

      我们看到这个市场在迅速增长,去年的出货量增长了大约70%。

      然后我们会试图进入所有的DPP(Data-PlaneProcessor)领域,包括DSP、音频视频、安全,以及深嵌入式控制,这其实和应用处理器的范畴离得很远。所以啊,我们常常会发现自己和MIPS、ARM或Intel出现在同一块芯片上。你知道吧,其实我们就是工厂的工人啊(Chris突然哈哈大笑)!因为有这么多不同的处理器,在Date-Plane里又有这么多不同的任务,那些小而高效的处理器会有很多机会,很多接口(Socket)。 

      这种对于应用处理器或者接口的互补性,甚至于可以让应用处理器在执行类似于信号处理这种实时任务的时候,也完全关闭。或者比如多媒体应用,应用处理器当然可以去做,但是如果我们优化专用音频DSP的话,将获得4到5倍的效率。尺寸更小,单位时间内的吞吐量却更大。而且可以用如此多的音视频处理器够你选择。所以几乎任何时刻,系统设计师或者SoC设计师都可以通过区别应用场景的方式,来决定卸载(OffLoad)哪个处理器。

      这也是为什么我认为我们可以在音频方面取得这么大的成功。当你正在设计一个手机,或者阅读显示器,或者机顶盒,或者数字电视,或者数码相机,你会说,啊,这里有一种场景需要我做大量音频的工作。于是,把那种卸载很自然地就被设计到到基本构架里去了。

      而且,我们可以为应用层面的处理器自动生成软硬件,尤其是基于音频和基带的非常全面的软件库(SoftwareLibraries)。因此,不管是老手还是菜鸟,在我们的店铺里都能找到他们所有需要的软硬件解决方案,以帮助他们最快地进入市场。集成音频、集成基带,或者其他各种功能。

      5、那么Tensilica有什么具体的应用吗?

      ChrisRowen:今天下午,我将讨论一下移动电话。这是一个巨大的市场,一个可以满足之前所说带宽需求的市场。特别是从当前正从3G向4G升级,大家都聚焦在LTE身上。不仅因为LTE看上去很像是最后标准的胜者,也因为它非常像WiMax。我们已经能够提供参考设计,帮助客户建立他们自己定义的多核LTE手机,在市场中抢得先机。这只是一个我们进入领域的实例。

      我们也在做一个很类似的数字电视解调器。因为有人希望既为移动应用又为起居室设计一种通用的数字电视接收器。这里有个很大的问题,就是全世界在视频领域有好多不同的标准和概念,而每个人都真心希望拥有一块可以解决一切的视频芯片。我们准备来设计一块。其实应用一样的原理,就是找些DSP和专用核,优化最密集的任务,并充分利用我们最重要的能力——生成处理器的功率效率非常小,以及和世上最稳定的通用DSP一样易于编程的软件工具。昨天晚上客户还和我们说,DSP如此招人待见的最主要原因就是可编程。譬如TI的那些DSP。我们同样在努力使编译器更强大,使程序模型简单,使程序员更不操心。我们还微处理器的流水线设计上增强了视觉效果。这种架构下要还能生成不正确的代码,也怪难的。

      因此,我们拥有一个非常高效的处理器。但是效率(Efficiency)这个词值得商榷。传统意义上而言,效率就是指最少的门数、最小的功耗,巴拉巴拉。但效率也是将产品推向市场的时间。需要多少工程师才能部署好这个系统?每行代码的成本是多少?每个工程师小时(EngineerHour)所能带来的收入?除了硅片层面的效率以外,这些同样是测量效率的重要参数。

      我认为我们在这两面都推动得很好。刚才讨论的那种架构,也特别适合在大量出货的领域。移动设备、客厅设备、数码相机,这些都是我们做得非常好的地方。这几个领域四大厂商中的三位,十大厂商中的六个都是我们的客户。

      我们主要是在DPP方面拥有很强的知识积累,但同样的影响也已经开始在云计算上面出现。当然,现在云计算的变化还比较慢,部分原因是它并非对功耗如此敏感,但我认为整体上还是会有影响的。

      6、您会在很多其他领域譬如数字电视和有线通信,使用这种结构?

      ChrisRowen:当然。那些可以为不同应用优化处理器的架构是很重要的。而且我们也发现,即使在一个新的水平,很多需求也是相似的。因此同样的Hi-Fi工具,同样的音频DSP,即可部署在世界最好的智能手机上,也同样可以部署在最好的数字电视、蓝光(BlueRay)影碟机上。因为它是非常小而快的。这方面的要求是相同的。

      同样,如果你看下AltasLTE的内部架构,其主要构造模块BBE16或许是世界上最快的DSP核。而它同样也在数字电视解调子系统中使用。同样再一次因为它的快速、易编程,以及节约功耗。所以,我们可以看到在手机和客厅之间,在这两个媒体处理器和基带处理器之间,都有着共同的需求。

      7、我看到您说,芯片的整合将集中在射频、存储和数字电路。那么您觉得它们三者还有可能合并成一个吗?

      ChrisRowen:嗯。如果你从半导体工艺(SemiconductorProcess)技术的角度来看,我认为在晶体管和器件优化的层面将会有些事情发生。因此在某些情况下,你可以作出权衡。特别是,我们正与很多客户一起工作,以简化射频电路。通过尽量多的数字处理器,你可以部分程度地脱离射频和数字间的边界。由于相比射频而言,数字会有更加陡峭的生产成本曲线(CostProductionCurve),我们也就有更大的动力去做。因此,我们会越来越依赖于数字方面的有效解决方案。

      同样的事情发生在存储器。人们偶尔也会使它们结合在一起,但不是一个简单的组合,内存的加工设备(FabricationFacility)与一般的优化有所不同。所以我相信,多芯片封装(Multi-ChipPackaging)将越来越重要。尤其当你将芯片组(Die)一块又一块摞起来的时候。所以,你可以在数字芯片组上面摞存储芯片组,然后上面再摞射频芯片组。这有可能在成本上是最划算的。然后也可能有一种折衷的工艺技术,把它们所有三个都放在一块硅片上。这取决于你的应用程序,比如需要一些存储单元,又或者需要一些射频的单元。

      但最终,我想我们还会坚持三套不同的加工工艺,然后依靠封装技术来整合在一起。不过这并不意味着,只要你能想办法把它们三个捏一块儿,你就得到一个系统(System)了。因为还有物理属性的要求,比如要多加块电池什么的。但总的来说你要知道,物理尺寸是会越来越小了。

      但你要知道还有个巨大的挑战,就是人们的手指不能变小,眼睛也不能变小。所以所谓得到“小尺寸”的设备,我们还是有实际限制的。我们在元器件层面的小,其实是对应于我们自己可以接受多小的屏幕和按钮。

      所以说到最后,这事儿还是更和成本相关。

资讯排行榜

  • 每日排行
  • 每周排行
  • 每月排行

华强资讯微信号

关注方法:
· 使用微信扫一扫二维码
· 搜索微信号:华强微电子