SDRAM Internals

作者:linuxer 发布于:2014-5-14 16:25 分类:基础技术

一、简介

SDRAM(synchronous dynamic random-access memory)是嵌入式系统中经常用到的器件。对于一个嵌入式软件工程师而言,了解SDRAM的机理是有益的。我们可以从下面三个方面理解SDRAM:

1、RAM很好理解,就是可以随机存取的memory。

2、dynamic 是和static对应的,SRAM就是static random-access memory。SRAM和DRAM(dynamic random-access memory)都是由若干能够保存0和1两种状态的cell组成。对于SRAM,只要保持芯片的供电,其cell就可以保存0或者1的信息。但是对于DRAM而言,其bit信息是用电容来保存的(charged or not charged)。由于有漏电流,因此DRAM中的bit信息只能保持若干个毫秒。这个时间听起来很短,但是对于以ns计时的CPU而言已经是足够的长了,因此,只要及时刷新(refresh,术语总是显得高大上,通俗讲就是读出来再写进去)DRAM,信息就可以长久的保存了。

3、synchronous 是和asynchronous 对应的。synchronous是一个有多种含义的词汇,对于硬件芯片这个场景,主要是说芯片的行为动作是在一个固定的clock信号的驱动下工作。对于电路设计而言,synchronous 简单但是速度慢,功耗大。asynchronous 则相反,在设计过程中需要考虑复杂的race condition的问题,其速度快,理论上只是受限于逻辑门(logic gate)的propagation delay。

1968年,Dennard获得了DRAM的专利。随后,各大厂商和研究机构对DRAM进行了改进。例如增加了clock信号,让DRAM的电路设计变成synchronous 类型的。2000之后,由于其卓越的性能,SDRAM完全取代了DRAM的位置。随后的发展(DDR、DDR2和DDR3)并没有改变原理,只是速度上升了。因此,本文以SDR(Single Data Rate)SDRAM为例,讲述其内部机理。

 

二、SDRAM cell

一个SDRAM芯片有若干个cell组成,每个cell可以保存一个bit的信息。SDRAM cell如下图(注:该图片来自网络)所示:

dramcell

电容Cs(电容的英文是Capacitor,s表示storage)的电荷状态(charged or discharged)可以表示0和1的信息。

首先我们看看如何向一个cell中写入数据。写入的数据体现在bit line的电平上,如果要写入1,那么将bit line设定为高电平Vs。如果写入0,那么将bit line设定为低电平。具体的写入动作体现在电路逻辑上就是对Cs进行充电或者放电。要完成这个操作需要将WL(word line)设置为高电平,以便让晶体管M1处于导通状态,这时候,Cs和bit line共享电荷了。对于写入1,Cs被充电,电压升到Vs。对于写入0,Cs被放电,电压为0。

数据读取要比数据写入复杂一些。假设该cell已经保存了一个bit的数据,我们打算将其读出来,那么需要首先将WL设置为高电平,以便让晶体管M1处于导通状态。这时候逻辑电路block可以通过BL(Bit line)感知电荷的重新分配(redistribution),从而确定Cell中保存的是0还是1。假设充满电荷的Cs表示1,其上的电压是Vs,如果保存了比特0,那么电容没有电荷,电压等于0。为了感知Cs的电荷情况,我们需要将BL上的电压提升到Vs/2。一旦M1处于导通状态,如果Cell中保存了比特1,那么由于电压差,电荷流出Cs导致Bit line上的电压升高,Cell之外的一个逻辑电路block(术语叫做Sense amplifier)可以感知这个变化,从而读出数据1。对于数据0也是一样,只不过电荷是流向Cs,bit line上的电压降低。总结一下,read sequece如下:

1、将BL上的电压提升到Vs/2

2、set WL high ,让M1处于导通状态

3、感知bit line的的电荷状态

4、write back。由于读出的操作是破坏性的(电荷的流出或者流入),因此读操作之后需要refresh。

 

三、SDRAM 芯片的组织

在了解了一个基本的cell组成之后,我们来看看这些基本的cell如何组织起来,完成数据存储。我们用Micro的64MB(512Mb)的Mobile LPSDR SDRAM MT48H32M16为例来描述SDRAM芯片的结构。我们先给出一些基本的描述(有些概念后续再定义):512M个bit被分成了4个bank,每个bank有8M个supercell,每个supercell有16个cell组成。4x8Mx16=512Mb。对于bank,其8M个supercell不是线性组合的,而是组成矩阵,通过Row address和Column address进行访问。组成示意图(注:该图片来自网络)如下:

dram-array

一个bank是由若干逻辑电路block组成,具体包括存储阵列、Sense Amplifiers、Row Address Latch and Decoder、Column Address Latch and Decoder以及Data buffer &control。

对于计算机系统,我们不可能是一个bit一个bit的访问,一般而言,32 bit的CPU可能是按照Byte(8个bit)、short int(16个bit)或者int(32个bit)进行数据访问。基于这样的概念,我们提出一个supercell的概念(这个概念来自Computer System, A Programmer's Perspective)。对于MT48H32M16这颗chip,16个cell组成了一个supercell,其实也就是输出数据总线的宽度。一次SDRAM的访问最大可以输出16个bit。如果想要基于Byte的访问,那么需要CPU给出DQM信号,以便mask高8bit或者低8个bit。由此可见,在SDRAM内部,其寻址的最小单位是supercell。

访问super cell的时候需要raw address和column address。选中的supercall通过Data I/O buffer输出数据。对于MT48H32M16这颗chip,一个bank的supercell矩阵是由8196行,1024列组成。

一个SDRAM芯片是由一个或者多个bank再加上一些逻辑控制电路block组成。到底bank是个什么概念?为什么需要bank,或者说single bank和multi bank相比有什么差异。现代的SDRAM芯片的容量已经越来越大了,用单一一个supercell矩阵会带来成本、性能以及复杂度的问题。此外,需要指出的是多个bank上的操作是独立的,也就是说,一个bank上选中了一个Row,或者进行precharge的操作并不影响其他bank上的读写操作。这样并行的操作可以加快SDRAM的速度。

 

四、和SDRAM controller的连接

SDRAM和 SDRAM controller的连接信号如下表所示(具体的数据以MT48H32M16为例):

signal name direction description
地址线 CPU输出到SDRAM芯片(下面简称输出) CPU输出给SDRAM芯片的Row address和column address可以通过地址线输入。由于分成Row address和column address,地址线不需要那么多了。例如:64MB的RAM如果线性排列,需要26根地址线,由于是矩阵结构,Row address(8196行,13根地址线)和column address(1024,10根地址线)是复用的,因此只需要13根地址线就OK了
BANK地址输入 输出 选择4个bank中的一个
数据线 I/O 16bit的数据输入输出信号线。在系统设计的时候,我们可以选择16bit或者32bit组织的SDRAM chip,不同的选择其实是在性能(32bit的要快一些,一次4B操作不需要分成两次访问了)和系统size(32bit占用了太多的I/O line,如果系统有太多的器件,那么pin assign非常困难,可能要引入I/O expander这样的器件)做平衡。
DQM信号 输出 Data Mask信号。32 bit的CPU访问memory的时候有1B、2B和4B的方式。当访问数据的宽度小于实际数据线的宽度的时候就需要data mask,将不需要的高(或者低)字节(或者16bit)mask掉。
clock信号 输出 之所以是synchronous就是因为有clock作为节拍器,让SDRAM的每一步按照固定的节拍动作(在clock的positive edge上触发)。典型值是133M clock,每个clock是7.5 ns。当然,目前最快的DDR3的器件其clock可以达到800MHz了。
CKE信号 输出 clock enable信号。在有些电源管理状态下会控制该信号,以便获得更好的电源管理performance。为了完成数据传输,CKE信号需要enable,以便把来自SDRAM controller的clock信号传递给SDRAM内部的各个HW block。
片选信号 输出 低电平的时候选中该SDRAM芯片
RAS,CAS,WE 输出 RAS(Row Address Strobe)和CAS(Column Address Strobe)表示地址线上的地址信号的类型,是Row address还是Column Address。WE的电平状态可以标识本次对SDRAM的操作是read还是write

 

五、SDRAM Command

通过上面章节的signal,CPU(SDRAM controller)可以向SDRAM发送各种命令,具体什么样的信号状态组合形成什么样的命令可以参考芯片datasheet的True table,这里只是从功能层面介绍各个SDRAM command。SDRAM上的每一个bank都会维护一个状态机,如下:

STATE M

具体的命令解释如下:

1、ACTIVE。根据section 2中介绍的内容,要访问cell中bit的内容,必须先导通cell中的晶体管M1。ACTIVE命令就是干这个工作的。该命令需要携带bank address和Row address的参数,告知具体是要选择后续要访问哪一个bank的哪一行(后续要访问的具体数据的column地址在READ或者WRITE命令提供)。一个bank中,同一时间只能active(让该行的Word line设置为高电平,以便导通cell的晶体管)一行。如果想要发送ACTIVE命令去本bank中的另外一行,直接发送是不行的,必须要close(PRECHARGE)之前打开的那个行。如果想要发送ACTIVE命令去另外一个bank中的某一行则没有这个限制(要满足tRRD的要求),这种跨bank的访问可以减少访问行的开销。

2、PRECHARGE。从用户层面看,PRECHARGE命令就是DEACTIVE命令。ACTIVE命令打开某个bank中的一行(导通这一行所有cell的M1晶体管),以便后续访问具体某一个column的supercell的内容。但是一旦访问完成了,就需要关掉之前打开的那个行(如果不关,该行的所有cell的晶体管M1处于导通状态,那么电容上的数据是无法保存的,除非bit line处于高阻状态)。其实通常PRECHARGE不需要指定Row address,毕竟一个bank中,同一时间只能active一个行。因此,PRECHARGE命令有两种mode,一种是PRECHARGE一个bank,这时候需要携带bank address的参数;另外一种情况是PRECHARGE All bank,不需要携带bank address的参数,该命令会将所有bank上的active的行close掉。地址线的A10用来选择PRECHARGE All bank或者PRECHARGE specific bank。为什么可以复用A10地址线?因此发送PRECHARGE的时候一定是已经提供ACTIVE命令发送了Bank地址和Row地址,这时候,地址线只会使用A0~A9(MT48H32M16有1024个column,使用A0~A9这10条地址线就OK了)。

3、WRITE。WRITE命令会携带Column的地址,说明是对哪一个supercell进行操作。这时候,bank地址、Row 地址、Column地址都是ready的,选中的supercell中的data就会保存为data总线上的数据。除了column地址,WRITE命令还有一个参数就是是否进行auto precharge(通过A10进行选择)。如果auto precharge,完成WRITE操作后,会对本次操作涉及的行进行PRECHARGE的操作。如果没有选择auto precharge,那么完成WRITE操作后,该行保持打开,以便后后续对该行进行持续的访问。理解了这些基本的概念后,问题来了,如何配置auto precharge?在WRITE之后自己进行PRECHARGE也就是意味这close了当前的那一个Row,PRECHARGE命令之后,tRP时间之后,该行又可以接受下一次的访问(ACTIVE then READ or WRITE)。但是,如果下一次对数据的访问是和当前访问的数据在同一行的话,我们其实是不必PRECHARGE,直接进行访问就OK了,这样,数据访问速度会快些。

4、READ。和WRITE命令一样,READ命令也会携带Column的地址,说明是对哪一个supercell进行访问。这时候,bank地址、Row 地址、Column地址都是ready的,选中的supercell中的data就会反应到data总线上。auto precharge的设定和WRITE命令一样,这里不再赘述。

5、SDRAM芯片power on之后需要有一个Initialize的动作,init之后,状态机才会迁移到Idle状态。初始化过程中最重要的是LOAD MODE REGISTER。SDRAM controller和SDRAM进行通信,那么需要对通信参数进行沟通,大家都是按照同样的通信参数进行沟通,数据才会能正确的访问。这些参数包括Burst Length、CAS latency等(其他参数这里不再详细描述)。Burst length比较好理解,一次对SDRAM的访问是一个操作序列:ACTIVE--->READ/WRITE---->DATA0--->DATA1 …--->DATAn。Burst length描述了在这个序列中DATA的数目。burst length如何设定呢?其实这是和程序逻辑相关的,如果程序是顺序访问,毫无疑问,多个DATA可以节省命令序列带来的开销。如果程序是随机访问,那么一个burst的数据很多都是浪费的。由于局部性原理(好的程序需要有好的locality,也就是说cache friendly),当前的系统结构都是采用了cache,一般而言,cache line是32字节,那么如果burst length设定为32字节,那么,一次burst正好加载了一个cache line。CAS Latency的具体含义请参考section 6中关于timing参数的描述。

有些电源管理相关的command这里没有描述,具体请参考Section 七的描述。

六、SDRAM的timing

从软件角度来看,程序员需要对SDRAM controller的寄存器进行设定,而这些寄存器中,很大一部分是对SDRAM的timing参数进行设定,本节将重点描述SDRAM的timing参数。

1、CAS Latency的含义是这样的:在READ命令后就选定了列地址,这时候就已经确定了具体的存储单元,剩下的事情就是数据通过数据I/O 通道输出到数据总线上了。但是在READ命令发出之后,仍要经过一定的时间才能有数据输出,从READ命令发出到第一笔数据输出的这段时间被定义为CAS Latency。CAS Latency是和read操作的performance有关系。

2、tRAS参数。ACTIVE命令和PRECHARGE命令是一对相反的操作,这两个命令之间有一定的时序要求,就好比你让一个人向东跑,立刻又让他向西跑,人总是要反应时间的。硬件也一样,SDRAM在发送了ACTIVE命令后,需要在tRAS之后才能发送PRECHARGE命令。此外,这个参数也限制了self refresh命令和exit self refresh之间的时序,也就是说,在进入self refresh状态后,必须停留tRAS的时间段之后才能退出该状态。具体self refresh状态的含义请参考Section 7的描述。

3、WRITE recovery time(tWR)。数据总线的数据在锁定在SDRAM的Data buffer中后需要一定的时间写入到cell,这个时间就是WRITE recovery time,如果立刻发送PRECHARGE命令的话,数据可能来不及写入(发送PRECHARGE意味该row的晶体管M1截止状态,bit line和cell中的storage capacitor就不导通了)。因此SDRAM controller需要在tWR的时间之后才能发送PRECHARGE命令。

4、ACTIVE-to-READ or WRITE delay(tRCD)。在发送WRITE/READ命令之前需要先发送ACTIVE命令(select bank and activate row),这两个命令之间有一个时间间隔(这时候硬件需要进行Bank地址译码、Row address 译码、此外还包括晶体管的导通时间等),这个间隔被定义为tRCD,该参数和SDRAM的读写性能有关。

5、PRECHARGE command period(tRP)。发送PRECHARGE命令,关闭BANK中的Active的Row是需要时间的,tRP时间之后,硬件完成了相关动作,回到idle状态,这时候才可以后续发送Self refresh命令、Auto refresh命令或者发送ACTIVE命令进行数据的访问。

6、ACTIVE-to-ACTIVE command period(tRC)。这是向SDRAM的某一个bank连续发送ACTIVE命令的时间间隔要求。在发送了ACTIVE命令后,至少要经过tRAS之后才能发送PRECHAGE,而PRCHARGE也需要一定的时间(tRP),因此tRP + tRAS >= tRC。

7、Refresh period(tREF)。对于SDRAM芯片,要不断进行刷新(Refresh)才能保留住数据(这也是和static RAM的本质区别),具体的刷新频率和实际的SDRAM chip相关,一般而言要64ms(或者更少的时间)内就要完成对bank内的所有的行数据的刷新动作。

8、AUTO REFRESH period(tRFC)。发送了AUTO REFRESH之后,SDRAM要对各个bank的各个Row进行refresh,这个需要一定的时间,这个时间段过后,SDRAM chip才会接收ACTIVE命令以便进行后续的数据访问。一般而言,SDRAM controller的寄存器中会有一个是和Auto Refresh设定相关的寄存器,假设Refresh period(tREF)是64mS,那么该寄存器的设定要保证SDRAM controller每64ms内要发起refresh的操作。

上面就是SDRAM的主要的timing参数,在具体设定的时候,要考虑SDRAM controller的clock以及具体SDRAM芯片的速度。一般而言,SDRAM的datasheet上会给出具体timing的要求,例如a ns,如果SDRAM Controller的clock是133MHz,也就是说一个clock是7.5ns,那么将a ns换算成整数个SDRAM clock,之后设定到SDRAM controller的寄存器就OK了。

 

七、SDRAM的电源管理

在进行电源管理之前,先了解一些基本概念的东西,也是AUTO REFRESH 和 SELF REFRESH的概念。本身Auto Refresh用于正常操作期间(AUTO REFRESH 其实和电源管理关系不大,但是和SELF REFRESH有点关系,因此这里一并谈谈),每隔一定的clock,SDRAM controller就会发起一个auto refresh的动作(多谢SDRAM controller,系统软件工程师不用关注这样的动作),在刷新过程中,所有对SDRAM的正常访问都不被允许,在tRFC之后就可进入正常的工作状态。而Self Refresh用于系统power down的时候,这时候,SDRAM controller不再提供clock信号(AUTO REFRESH 和SELF REFRESH在硬件信号上就差别在CKE信号上,SELF REFRESH的CKE是disable的),SDRAM芯片内部逻辑会启动对所有cell的刷新动作,从而保持SDRAM中的数据。

SDRAM的电源管理状态有以下三种:

1、Deep Power Down。SDRAM controller发送Deep Power Down命令可以将SDRAM芯片推送到一个极低功耗状态(约15uA)。这时候存储阵列的power会被shutdown,也就是意味着所有的数据是丢失掉了,这时候,mode register的设定是保持的。当从Deep Power Down退出的时候,需要对SDRAM芯片进行一个完整的初始化过程。

2、Power Down。在CKE是低电平的情况下,发送一个NOP或者INHIBIT命令就可以让SDRAM进入power down mode。Power Down有两种mode,一种叫做PRECHARGE POWER-DOWN,另外一种叫做ACTIVE POWER-DOWN。如果在所有bank都是idle状态下(没有打开的行)进入Power down mode,那么这种mode就叫做PRECHARGE POWER-DOWN(该状态的功耗大约是300uA)。如果在有打开行(active row)的情况下进入Power down mode,那么这种mode就叫做ACTIVE POWER-DOWN(该状态的功耗大约是6mA)。想让SDRAM芯片退出power down mode的时候,要拉高CKE信号,发送一个NOP或者INHIBIT命令就可以让SDRAM退出power down mode。为了进一步降低功耗,可以把SDRAM controller的clock输出disable掉(这时候CKE是disable的,即便是SDRAM controller产生了clock信号,SDRAM的内部逻辑电路也不会被驱动)。看起来一切都很美,问题来了,数据是否可以保持?很遗憾,超过了Refresh period(tREF)后,SDRAM中的数据就不会保持了。因此,为了保存数据,我们可以让SDRAM controller在auto refresh timer超时的时候退出power down mode,完成refresh的操作,之后,如果没有pending的数据,继续进入power down mode。

3、Self Refresh。这种mode的功耗在1mA以下。在这种状态下,SDRAM芯片自己完成refresh的操作,不需要SDRAM controller的干涉(Auto refresh需要)。既然有刷新,SDRAM中的数据是自然可以保持住的。SDRAM进入self refresh后,SDRAM controller也会disable输出到SDRAM的clock,从而整体的功耗都降低下来。

对于软件工程师,除了timing的设定,SDRAM芯片已经SDRAM controller的电源管理相关的控制也是主要内容,这部分的内容和具体的SDRAM controller相关,不过掌握了上述内容之后,应该很容易进行配置,这里就不再具体描述了。


原创文章,转发请注明出处。蜗窝科技www.wowotech.net

标签: SDRAM

评论:

HelloWorld
2016-12-13 11:59
您好,我想问一下关于内存读取和寻址的问题~最近看了不少相关文章,感觉有点混乱。。。

寻址是个什么概念?是不是说只是把行列地址给解码了,但并没有对行列(或者说字线和位线)进行操作?
linuxer
2016-12-14 09:15
@HelloWorld:我的看法和理类似的,寻址的操作仅仅是定位到cell,而不进行实际的read或者write的操作。但是,实际上,寻址往往是和load或者store捆绑在一起的,是一个不可分隔的整体。
floater
2015-10-20 20:18
文章是说ddr的概念和工作原理,有没有关于ddr驱动的介绍?一般来说可能是对IP的软件应用
linuxer
2015-10-20 22:09
@floater:ddr驱动一般就是初始化代码而已,在bootloader中,有了这些基础知识,其实ddr的驱动或者初始化部分的配置是非常容易理解的。
linuxer
2014-12-23 18:23
tigger同学,你偷换了我的概念哦。一个人的忙和闲与创造的价值是无关的。一个人负责一个模块,由于代码结构不好,不断的挖坑(有issue),不断的填坑(fix issue),当然很忙,也做了功,出了力,不过创造的价值(对公司而言)是非常少的。

公司在评价一个人的时候还是要看给公司带来的价值而不是忙闲程度,如果那样的话,很多人都会装作很忙的样子,也有人会自己挖坑,不过很遗憾,很多公司做不到这一点,对管理者而言,判断忙闲还是比较简单的,判断一个人的价值相对要困难一些的,需要一个聪明的领导才行。
tigger
2014-12-24 09:55
@linuxer:嘿嘿 被你发现了
这是我好久都在思考的问题,比如还有下面的问题
一个linuxer是找一个正常上班时间就足够的工作,有很多业余时间去给自己充电,不断提高的工作呢
还是找一个每天都很busy,但是都是辛苦钱的工作呢
我还是比较纠结
到底是要挣辛苦钱呢?还是钱少点,但是轻松点。这个命题我一直在思考,没有结论。我现在是第二个工作状态。哈哈哈
tigger
2014-12-24 09:58
@tigger:现在是每天都很busy,挣辛苦钱的阶段。嘿嘿
wowo
2014-12-24 10:16
@tigger:我觉得,理想的工作状态,是你这两个状态的结合:工作既轻松(指的是内心,热爱这份工作)、又挣钱、还能积累很多知识为自己充电。
并且,个人意见,一个成熟、完善的社会里,各行各业,都应如此。这也是“关于蜗窝”中所想表述的、类似乌托邦似的理想。
tigger
2014-12-24 10:31
@wowo:我的个人的愚见啊,一个成熟、完善的社会里,社会的保障制度会做的非常的好,一个人可以不为吃不上饭而发愁。做任何的工作都能至少保持温饱。这样人就会选择自己爱好的东西作为职业。而不是势力的选择挣money多的。比如举个例子,很多欧美的有完善社会保障体系的国家,普通女生找老公可以不为钱出发,在乎的是男生幽默不幽默,有没有才华,爱不爱我。这也是前段时间发生很多原配杀小三事件我的思考。
当一个家庭主妇跟男主人离婚之后,她没有了生活的保障。因为她为了家庭把自己的才华都磨灭了,然后当她的生活来源得不到保障的时候。她就会本能的憎恨那个抢她男人的。
当然上面的可能是片面的思考,但是我感觉make sense
wowo
2014-12-24 11:11
@tigger:好吧,我想说的被你说了。我不说的原因是,任何事情,一旦涉及到社会问题,对我们来说,都是无解的。我们能做的,就是尽个人的努力,做好自己的本职工作。然后,如果可以,为改变现状做一点点努力,哪怕一点点,都可以…
tigger
2014-12-24 11:48
@wowo:我也是一时没有忍住,哈哈。所以社会问题的根源可以知道,但是讨论就不必了。因为现在看来是无解的。我现在心态已经很平和了,体制就是在这里,无法撼动。我们能做的就是一点点的为改变而努力。这也是我喜欢wowo的原因啊。if you want something,try your best and god will do the rest
wowo
2014-12-23 18:22
@tiger, 功率大不一定效率高啊,所以功率和忙闲对应倒也恰当。
tigger
2014-12-18 17:21
下面地址里面讲内存的文章也不错。讲的也很细致。可以对照楼主的文章来看。
http://bbs.pceva.com.cn/thread-29050-1-1.html
tigger
2014-12-07 17:50
Precharge 没看到能对row进行操作啊,为啥可以deactive呢?ACTIVE是选中一行,但是之前的描述PRRCHARGE是将BL电压设置到Vs/2。
不好意思,我没有先去查看网上的其他文章就直接提问了。按照常理我应该先学习再来发问的。
linuxer
2014-12-07 23:08
@tigger:这里我没有说明清楚,这里有两个precharge的词语,用在两个不同的场景中,一个是描述在进行cell的读操作的时候,使用了precharge讲BL的电压升到Vs/2。另外一个场景描述SDRAM controller发送PRECHARGE的命令,这个操作仅仅是操作WL,将一个行中的所有cell的M1三极管处于截止状态。

为了不引起歧义,我还是把第一个场景中的precharge修改一下吧
tigger
2014-12-07 17:39
还有这个里面有很多时间点的缩写,但是好像没有具体的时序图啊?
linuxer
2014-12-07 23:00
@tigger:datasheet中的时序图非常多,我就没有贴上去,有空也可以补上
tigger
2014-12-07 15:33
还有一个问题,就是ddr bitflip这种现象一般是什么阶段出现呢?
当cpu 的额sleep之后,为了省电,这个时候ddr phy 应该是掉点吧。我想知道这个时候ddr的数据都丢失了吗?
据我的现有认识,cpu deep sleep之后的code应该会跑在iram,那么resume的时候一定是从iram跳到ddr,这个时候ddr应该要做一系列的操作保障ddr工作正常。比如ddr training 等等,不知道楼主对这一系列操作有没有了解啊?
linuxer
2014-12-07 22:59
@tigger:cpu deep sleep之后不会跑着iram中的code,因为这时候CPU已经不会取指令运行了。好的CPU应该在deep sleep之后应该shutdown包括CPU核心电压在内的大部分供电,仅仅保留一个非常小的SOC 上的一个HW block的供电,这个供电域应该包括RTC,2~3个GPIO,从deep sleep唤醒的逻辑电路,至少有一个scratch寄存器,保护了sleep那一点的PC值。

如果你想suspend to RAM的话,DDR的供电一定要保持。如果是suspend to disk的话,当然也可以shutdown DDR chip的供电。

当resume的时候,由于cpu core是完全下电的,因此cpu通用寄存器的内容全部都保持不住了(iram是否能保持住数据是和SOC系统的电源管理设计相关的),这时候,PC一般会等于0,也就是说从0地址开始取指令执行,具体0地址是什么也是和SOC设计相关,可能是ROM代码,也可能是NOR flash代码(也就是bootloader的代码了),但无论如何,最终是从scratch寄存器中恢复PC至,跳转到DDR ram中执行

ddr training和ddr bitflip我没有接触过,你可否给讲一讲?
tigger
2014-12-18 20:10
@linuxer:The DQS signal on the memory interface is bidirectional.  The PHY in many (not all) memory architectures will generate a DQS gate signal that switches the read DQS capture logic on and off - on for reads and off for writes.  Gate training is the process of setting the timing of the read DQS gate to turn on prior to the first read DQS.  For DFI, the dfi_rddata_en signal is often used as part of the read DQS gate signal generation.  A delay line may be used to locate and set the optimal timing margin for the gate.  One way to do gate training, as discussed above, is to first align the rising edge of the gate signal to the rising edge of the first read DQS in a read burst.  Once this alignment is know, the gate signal can be moved back far enough from the first read DQS to provide necessary timing margin.  There may be other ways to do gate training as well.
tigger
2014-12-18 20:12
@linuxer:从ddr phy的datasheet上面来看,ddr training过程就是写几个training的寄存器。实际的操作我还要继续探索才知道
wowo
2014-12-22 18:25
@tigger:貌似Linuxer同学这一段时间比较忙?估计又被老板盯上了,哈哈
tigger
2014-12-22 19:16
@wowo:有可能,我前段时间也比较忙,文档都没仔细看了,等后面要补上了
wowo
2014-12-22 19:31
@tigger:是啊,年底了,都很忙。大家要努力工作挣钱,不然年都不好过啊~~~~呵呵
linuxer
2014-12-23 09:25
@wowo:每当target board回来的时候总会忙一阵子......不过话说回来,如何定义忙呢?有没有绝对的忙呢,忙是不是相对的?处于静止状态的tigger和乘坐0.5倍光速的列车上的wowo同学观察到linuxer忙的程度是否一样呢?继续思考中......

PS:最近在思考狭义相对论
wowo
2014-12-23 09:59
@linuxer:帅哥想多了,一个是物理学,一个是心理学,木可比性~~
就像老板和老妈,看到自己的忙碌程度绝对是不一样的啊,哈哈
linuxer
2014-12-23 10:11
@wowo:好吧,说是心理学也OK,我的思考方向是用功率来定义一个人的忙和闲,所谓功率就是每秒做的功,因此忙或者闲是和时间相关的,因此要考虑时间的相对行,要考虑时间和空间的关系,要考虑时间的方向,所谓时间的方向就是熵增的方向(根据热力学第二定律,对于一个孤立系统,其内部自发进行的与热相关的过程必然向熵增的方向进行。一个孤立系统如果不受外界任何影响,且系统最终处于平衡态,那么在平衡态时,系统的熵取最大值),因此要考虑宇宙大爆炸,要考虑很多很多,还是让我继续考虑吧.......哈哈哈
tigger
2014-12-23 16:53
@wowo:我的思考方向是用功率来定义一个人的忙和闲
两个不同的人,解决同样一个问题。
一个人用1s就解决了,另一个人用1天来解决。那怎么从功率上来定义一个人的忙跟闲呢?
这也是我一直在思考的问题,同一个公司,两个人拿基本相同的薪水,一个人看起来很忙,其实是他水平有限,问题解决需要更多时间。另一人看起来很闲,因为交给他的任务都很快解决了。但是两个人负责不同的模块,那么怎么来评判这两人对公司的价值呢?领导又怎么能知道这两人价值的不同呢?
tigger
2014-12-07 14:29
今天看了一点,一个bank的supercell矩阵是由8196行根1024列组成
看不太懂,这里一行 一列 应该不是对应WL BL吧?
tigger
2014-12-07 15:19
@tigger:或者说 从cpu的角度应该看不到cell吧,他能访问到的最小的单位是supecell吗?
linuxer
2014-12-07 22:44
@tigger:CPU看不到cell,CPU只能看到线性地址。SDRAM controller把CPU的地址操作转换成行地址、列地址,bank地址。

CPU能访问的最小单位就是supercell。不过也不需要纠缠于supercell这个概念,这不是一个通用的概念。
linuxer
2014-12-07 22:41
@tigger:WL和BL是真对一个cell描述时使用的术语。
当我们描述一个SDRAM芯片的时候,最小的寻址单位就是supercell,“8196行、1024列”都是针对一个supercell而言。

针对这个场景,1024列上的所有cell共享一个WL,选中某一行,就是设定WL为高电平,导通1024列上的所有cell的M1三极管,共计1024 X 16个cell。选中某一列,则选中了一个supercell,共计16个BL
qianzhibing
2014-12-04 16:10
我的理解:
一般SDRAM和接口控制器都支持同时打开多个BANK工作,因此在不同bank操作效率是比较好的,设计的好能背靠背交错访问,减少不少等待的时间,但这一般都是底层设备驱动需要大数据量的内存操作才会考虑,比如显示相关的内存。及时这种场景,大部分系统也不会考虑专门设计,因为这确实比较麻烦,而带来的性能提升也不明显。
同一BANK切row因为需要precharge等待时间,因此效率偏低,但一般对于用户空间程序,本身对大块连续内存的操作的需求也很少,并且对这点效率损失也基本可以忽略。
linuxer
2014-12-04 18:29
@qianzhibing:同意,在实际的系统中,由于L1 L2甚至L3的cache的引入,实际上SDRAM上性能的提升反应到系统应该非常小的。

发表评论:

Copyright @ 2013-2015 蜗窝科技 All rights reserved. Powered by emlog