一文看懂JTAG基本知识
在此指令下,每个芯片的DR寄存器会延时一个时钟周期,那么我们发送一个数据后,检查延时多少周期收到数据,即可知道JTAG链上芯片的数量。JTAG可以控制芯片的每个引脚,图3中,我们可以通过JTAG使得所有的CPU引脚发送数据,而所有的FPGA引脚接收数据,然后根据FPGA中是否收到准确的数据来判断所有的芯片连接是否正常。每个IR寄存器都有一定的长度,我们假设CPU的IR寄存器是5位,FPGA的寄存器
1、JTAG是什么?
JTAG是20世纪80年代开发的IEEE标准(1149.1),用来解决电路板的生产制造检修问题。现在JTAG还可以用来烧程序、调试以及检测端口状态。本文主要介绍JTAG的基本功能,边界扫描。
1.1边界扫描
如图1所示,在一个电路板上有两个芯片元件,一个CPU和FPGA。
图1
每个芯片都会有很多引脚,那么芯片之间的互联就会有很多连线,图2示意图仅仅画了4条连接线。
图2
正常情况下,对于芯片厂商,一次制作成千上万个PCB板子,每个班子上都有许许多多连接线,厂家需要如何保证每根芯片连接线都是正常的呢?这么大的工作量也不可能通过手工来每一根线进行检测。因此JTAG就应运而生了。
图3
JTAG可以控制芯片的每个引脚,图3中,我们可以通过JTAG使得所有的CPU引脚发送数据,而所有的FPGA引脚接收数据,然后根据FPGA中是否收到准确的数据来判断所有的芯片连接是否正常。
实际上JTAG的连接包括4根信号线,分别是TDI、TDO、TMS和TCK。从电脑主机的角度来看,TDI、TMS、TCK为输出,TDO为输入,如果从待测试的芯片角度来看则相反。
图4
JTAG的四根信号线有特定的连接方式,如图5所示,TMS和TCK是并联在所有待测芯片上的。
图5
TDI和TDO信号线则是串联在一起形成一个闭环链条。在JTAG的技术手册中,这种方式也叫JTAG链。
图6
因此,每个JTAG链上的芯片都会有四根线连接,其中三个输入,一个输出。在技术手册中,还会有一个可选的信号线TRST作为第五根信号线。一般而言,JTAG的四个引脚都是专用引脚。
现在所有的JTAG应用越来越普遍,基本上所有多引脚的芯片都会包含JTAG边界扫描功能。此外正如我们开头所说,CPU和FPGA厂商还用JTAG接口进行调试,对于可编程硬件FPGA和CPLD,还可以用JTAG接口继续配置和烧录程序。
2、JTAG如何起作用?
上一章我们知道了JTAG是如何连接芯片,现在学习具体工作原理以及如何通过PC端来控制器运行。
2.1PC控制JTAG
一般我们用JTAG连接线来连接PC和JTAG端口,电脑端口有并行端口(也叫打印机端口db25)、USB端口以及网线端口。对于数据量不大的情况下推荐并行端口,操作简单。对于大数据量推荐USB端口和网口,其速度快但是操作复杂一些。
图7 并行端口DB25
2.2、并行端口
电脑主机的并行端口12根线为输出,5根线为输入。对于JTAG而言,只用到了3个输出和一个输入(从PC角度来看输入输出)。因此,中间需要用到一些缓存器,如赛灵思的parallel-III cable。
从软件代码的角度来看,并行端口由于简单是最理想的JTAG端口。例如,阿尔特拉的ByteBlaster JTAG接口用C语言改变TCK信号代码如下:
#define lpt_addr 0x378
#define TCK 0x01
void toggle_TCK()
{
outport(lpt_addr, 0);
outport(lpt_addr, TCK);
outport(lpt_addr, 0);
}
2.3、JTAG TAP控制器
PC和芯片之间的JTAG连接方式如图6,下面介绍这四根信号线分别代表什么意思。
TCK
TCK是JTAG的时钟信号,另外三个信号TDI、TDO、TMS都是跟该时钟信号同步的。一般其他三根信号都是在TCK时钟的上升沿发生改变或者状态的切换。
TMS
在每个芯片的内部都有JTAG TAP控制器,图6中有两个CPU和FPGA两个芯片,那么就有两个TAP控制器。一般我们在数据手册上看到的状态控制器就是这个,它有16个状态,如图8所示。TMS就是个控制TAP控制器的信号,根据TMS的高低电平变化,TAP控制器进入这16个状态中的一种,又因为同一个PCB板子上TMS是并联所有芯片 ,因此所有芯片都会处于同一状态。
图8
上图中每个状态旁边的0和1代表的是TMS的低、高电平。比如如果TAP状态控制器处于Select DR-Scan状态,且TMS为0,那么当TCK时钟信号切换时,TAP的状态就会变化下面的Capture-DR。
这里再强调一遍,要想JTAG正常工作,所有的链上的TAP控制器必须处于同一状态。PCB板上电后,是如何保证所有芯片的TAP处于同一状态呢?仔细观察图8,不管TAP在哪个状态,如果TMS在5个时钟周期内都保持1,那么TAP都会变成Test-Logic-Reset状态,这便是用来同步TAP状态的方法。
来看下面的代码,如何将TAP控制器切换到Shift-IR状态。
// first sync everybody to the test-logic-reset state
for(i=0; i<5; i++) JTAG_clock(TMS);
// now that everybody is in a known and identical state, we can move together to another state
// let's go to Shift-IR
JTAG_clock(0);
JTAG_clock(TMS);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
TDI和TDO
现在我们已经知道了如何切换TAP状态了,下面介绍JTAG最重要的两个状态Shift-DR和Shift-IR。
图9
Shift-DR和Shift-IR必须结合TDI和TDO信号线才能起作用,首先介绍Shift-DR。
每个芯片的TAP控制器中都有一个IR寄存器,也叫做指令寄存器。你可以把相关指令写入这个寄存器,然后TAP控制器会根据IR寄存器的指令进行相关操作。
每个IR寄存器都有一定的长度,我们假设CPU的IR寄存器是5位,FPGA的寄存器是10位,那么通过TDI和TDO的信号线连接方式,CPU和FPGA的IR寄存器其实是串联的,如图10所示。
图10
我们从PC主机的角度来看,整个链的IR寄存器是15位的,5位CPU和5位FPGA。
要想将IR寄存器写入数据,我们需要将TAP控制器的状态切换成Shift-IR,然后PC通过TDI信号线写入15位数据。前10位数据写入的是FPGA的IR寄存器,后5位数据写入的是CPU的IR寄存器。如果PC写入的数据多于15位,那么溢出的数据就会通过TDO信号线再被PC端给接收,只不过延时了15个时钟周期。
例如,我们想吧数值00100写入CPU的IR寄存器,而0000000010写入FPGA的IR寄存器,C语言代码如下:
// Because the bits are shifted through in a chain, we must start sending the data for the device that is at the end of the chain
// so we send the 10 FPGA IR bits first
JTAG_clock(0);
JTAG_clock(1);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
// then send the 5 CPU IR bits
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(1);
JTAG_clock(0);
JTAG_clock(0 | TMS); // last bit needs to have TMS active (to exit shift-IR)
在我们的假设中,CPU的IR是5位(可以表示数值0~31)。那么CPU的IR寄存器可以支持32条JTAG指令。实际上,一个CPU可能只会有5~10条指令,剩下的IR寄存器数值都没有用。
同样的对于FPGA,它的IR寄存器是10位,那么它可以支持1024条JTAG指令(大部分也是没用的)。
但是JTAG有几条强制的指令必须都有:
- BYPASS
- EXTEST
- SAMPLE/PRELOAD
- IDCODE(这个不是强制的,但是非常常见)
每个芯片的都有IR数值的指令集,从芯片手册上都可以查到。
每个芯片的TAP控制器都只有一个IR寄存器,但是会有很多DR寄存器。我们知道IR寄存器数据切换是通过TAP的Shift-IR状态,类似的,DR寄存器的数据切换也是这样,只不过状态时TAP的Shift-DR状态。
每一个IR寄存器的数值都会对应一个不同的DR寄存器,在我们的假设中IR寄存器为5位,那么就有32个IR数值,因此就有32个DR寄存器(如果32个IR数值都被当做指令的话)。
2.4、计算JTAG链中元件个数
IR寄存器的指令不同芯片有所区别,但是有一个指令是一样的,那就是BYPASS指令。它的IR寄存器所有位都是1。对于CPU是11111,对于FPGA的IR寄存器,其数值是1111111111。在BYPASS指令模式下,TAP控制器对应的DR寄存器是个单触发器,只是将TDI的输入数据延时一个时钟周期然后通过TDO输出。
根据这个特性,我们可以用BYPASS指令来计算JTAG链上有多少个芯片。在此指令下,每个芯片的DR寄存器会延时一个时钟周期,那么我们发送一个数据后,检查延时多少周期收到数据,即可知道JTAG链上芯片的数量。
具体实现的C语言代码如下:
// go to reset state
for(i=0; i<5; i++) JTAG_clock(TMS);
// go to Shift-IR
JTAG_clock(0);
JTAG_clock(TMS);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
// Send plenty of ones into the IR registers
// That makes sure all devices are in BYPASS!
for(i=0; i<999; i++) JTAG_clock(1);
JTAG_clock(1 | TMS); // last bit needs to have TMS active, to exit shift-IR
// we are in Exit1-IR, go to Shift-DR
JTAG_clock(TMS);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
// Send plenty of zeros into the DR registers to flush them
for(i=0; i<1000; i++) JTAG_clock(0);
// now send ones until we receive one back
for(i=0; i<1000; i++) if(JTAG_clock(1)) break;
nbDevices = i;
printf("There are %d device(s) in the JTAG chain\n", nbDevices);
2.5、获得JTAG链上芯片的ID
大部分的芯片JTAG模块都支持IDCODE指令,这个指令对应的DR寄存器是32位,具体数值代表者不同芯片的ID。
不同于BYPASS指令,INCODE指令的IR寄存器数值不是标准的,我们可以通过器件手册来查询。还有一种方法,当TAO控制器的状态处于Test-Logic-Reset时,它都会将INCODE数据写入DR寄存器中,我们可以据此读出DR寄存器的内容,C语言代码如下:
// go to reset state (that loads IDCODE into IR of all the devices)
for(i=0; i<5; i++) JTAG_clock(TMS);
// go to Shift-DR
JTAG_clock(0);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
// and read the IDCODES
for(i=0; i < nbDevices; i++)
{
printf("IDCODE for device %d is %08X\n", i+1, JTAG_read(32));
}
3、边界扫描
本章节讲解JTAG的边界扫描。当TAP控制器进入“boundary-scan”的状态,其实也就是IR寄存器存入SAMPLE指令、EXTEST指令等,此时对应的DR寄存器就是边界扫描寄存器,这个寄存器将每个I/O单元连接在一起并且可以控制每个引脚。
图11
当芯片正常过程当中也是可以进行边界扫描的,例如对正常运行中的FPGA进行边界扫描,它可以将每个管脚的状态显示出来。
3.1、SAMPLE
现在我们尝试读取管脚的值,对应的IR寄存器的指令是SAMPLE。每个芯片的具体指令数值不同,查找数据手册或者芯片的BSDL文件来获取具体的指令。BSDL全称是boundary scan description language,它是硬件描述语言(VHDL)的一个子集。
一个BSDL文件其实就是一个描述边界链的VHDL文件。下面是阿尔特拉的BSDL文件(Cyclone EP1C3 in TQFP 100 pins package):
attribute INSTRUCTION_LENGTH of EP1C3T100 : entity is 10;
attribute INSTRUCTION_OPCODE of EP1C3T100 : entity is
"BYPASS (1111111111), "&
"EXTEST (0000000000), "&
"SAMPLE (0000000101), "&
"IDCODE (0000000110), "&
"USERCODE (0000000111), "&
"CLAMP (0000001010), "&
"HIGHZ (0000001011), "&
"CONFIG_IO (0000001101)";
attribute INSTRUCTION_CAPTURE of EP1C3T100 : entity is "0101010101";
attribute IDCODE_REGISTER of EP1C3T100 : entity is
"0000"& --4-bit Version
"0010000010000001"& --16-bit Part Number (hex 2081)
"00001101110"& --11-bit Manufacturer's Identity
"1"; --Mandatory LSB
attribute BOUNDARY_LENGTH of EP1C3T100 : entity is 339;
从上面这个文件我们可以知道:
- IR寄存器的长度是10位;
- IR指令寄存器的指令清单,比如SAMPLE的是0000000101,也就是0x005;
- 该器件的IDCODE,00001101110是厂商的代号(阿尔特拉);
- 边界扫描链的长度是339位。
边界扫描寄存器有339位,并不意味着有339个管脚。
每一个管脚都有一个IO pad(芯片管脚处理模块),IO pad用1~3位寄存器(取决于该管脚是输入、三态输出或是输入输出均可)。当然一些IO pad包含的寄存器不一定包含在边界扫描链中。这就解释了为什么这个100管脚的芯片有339位的边界扫描寄存器。
接着看BSDL文件:
attribute BOUNDARY_REGISTER of EP1C3T100 : entity is
--BSC group 0 for I/O pin 100
"0 (BC_1, IO100, input, X)," &
"1 (BC_1, *, control, 1)," &
"2 (BC_1, IO100, output3, X, 1, 1, Z)," &
--BSC group 1 for I/O pin 99
"3 (BC_1, IO99, input, X)," &
"4 (BC_1, *, control, 1)," &
"5 (BC_1, IO99, output3, X, 4, 1, Z)," &
...
...
...
--BSC group 112 for I/O pin 1
"336 (BC_1, IO1, input, X)," &
"337 (BC_1, *, control, 1)," &
"338 (BC_1, IO1, output3, X, 337, 1, Z)" ;
这一段罗列了边界扫描寄存器的339位的用途。
例如,处于第4位(其实是位3,从0开始计算的)保存的是管脚99的值。
现在读取边界扫描寄存器,并且将管脚99的值打印出来:
// go to reset state
for(i=0; i<5; i++) JTAG_clock(TMS);
// go to Shift-IR
JTAG_clock(0);
JTAG_clock(TMS);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
// Assuming that IR is 10 bits long,
// that there is only one device in the chain,
// and that SAMPLE code = 0000000101b
JTAG_clock(1);
JTAG_clock(0);
JTAG_clock(1);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0);
JTAG_clock(0 or TMS); // last bit needs to have TMS active, to exit shift-IR
// we are in Exit1-IR, go to Shift-DR
JTAG_clock(TMS);
JTAG_clock(TMS);
JTAG_clock(0);
JTAG_clock(0);
// read the boundary-scan chain bits in an array called BSB
JTAG_read(BSB, 339);
printf("Status of pin 99 = %d\n, BSB[3]);
3.2、边界扫描寄存器
下图是阿尔特拉数据手册中TAP状态寄存器、IR寄存器、DR寄存器结构图,各层级关系比较一目了然。
图12
从图12中我们可以得出以下信息:
- IR指令寄存器(Instruction Register)的值决定采用什么指令以及选择对应的DR寄存器(Data Register);
- Bypass Register只有一位,其指令BYPASS我们上文已经讲过,其提供从TDI到TDO最短路径;
- 边界扫描寄存器是个移位寄存器,由芯片上所有的管脚BSC组成。
阿尔特拉的BSC全称是Booundary scan cell,它可以讲信号施加到管脚,或者获得管脚上的数据和内部逻辑信号。我们JTAG测试的数据也是串行输入到BSC单元中,捕获到的数据也是串行从BSC输出,进而判断测试结果。根据我的理解,此处的BSC就是我们上文提到的IO pad芯片管脚处理模块。
图13
3.3、JTAG还可以做什么?
- 控制芯片的引脚状态,对应的IR指令为EXTEST,表示外部测试,可以让输出管脚输出高低逻辑电平,根据输入接受到的电平信号检测JTAG链中任何设备管脚处的开路和短路情况;
- 用于FPGA和CPLD的配置;
- JTAG接口可以作为调试端口。
怎么样,通过本文的讲解是不是对JTAG有了基本的认识,欢迎有疑问的同学联系我交流学习,一起进步。
参考资料:
https://www.intel.com/content/dam/www/programmable/us/en/pdfs/literature/an/an039.pdf
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)