==程序大战1.1==创建时间:2003-08-15 文章属性:原创 文章来源:nsfocus & xfocus 文章提交:watercloud (watercloud_at_xfocus.org) ==程序大战1.1== 目录: 1. 简介 2. Mars体系结构 3. RedCode简单语法 4. 语法实例讲解 5. 简单实例 6. 如何实战 7. 相关资料 < 一 > 简介 程序大战也叫磁核大战,英文名为"CoreWars",是一个很古老的游戏,当年 比尔.盖茨上学时就有这个东东了,不过国内玩的人很少。 目前一些免费 Unix如FreeBSD等的ports里就有他。 这个游戏可以从名字也能看出来就是程序之间的大赛。就是大家都写一个 程序,然后我们把这些程序都放到内存,然后开始"并发"运行,看最终的 结果是谁的程序消灭了内存中的其他程序而存活了下来。 这一程序对抗模型可以看作是原始的病毒对抗。每个程序都要尽力的消灭 其他程序,为了能够生存,程序应该能保护自己,不断移动自身来躲过其他 程序的攻击或当自身受到攻击后能自我修复。 当然这些程序不是运行在家用PC上,也不是随便使用大家常用的intel汇编 来编写。其运行平台为Mars机。Mars是一种简单的计算机,他有固定的8000 个内存单元,和约10来个指令。然后整个大战程序就是由这些指 令完成。 < 二 > Mars体系结构 Mars机器由一个组内存单元,一个CU单元,一个简单进程管理系统,和一 组指令集构成。 Mars机的标准主要参考pMars虚拟机器标准,主要有两个:88标准和94标准。 以下都是默认为88标准,扩展94标准会专门标识出来。 该系统内存大小固定为8000个内存单元,每一个内存单元由5个部分构成: <1> OPCODE区:操作数区,该区域指定了机器指令,如MOV ,ADD。 <2> A数据区 :一个32位的数据存储区,存放相应数据,如128,-100。 <3> A数据区寻址修饰:指定了A数据区的寻址方式。 <4> B数据区。 <5> B数据区寻址修饰。 ( 94标准中加入了一个新的部分 <6>操作数修饰区。 ) 系统的寻址方式分为立即寻址,直接寻址,间接寻址。 (94标准中加入了新的间接A减1寻址、间接A加1寻址、间接B减1寻址、间接B 加1寻址) 系统寻址都是相对当前IP为基准寻址的,这是Mars系统和传统计算机最大的 不同之处。如 mov 0,1表示将当前指令所在的内存单元拷贝一份到当前指令 所在内存单元的下一个内存单元。 CU单元用于执行相应的指令,配合CU单元还有一个隐含的寄存器IP,每次执 行单元执行IP指定的内存单元的指令。 简单进程管理器管理进程。系统的进程由一个先进先出队列构成。每次管理系 统将当前进程的执行地址出队列放入IP寄存器,然后CU单元执行指令,最后将 该进程的下一条指令地址放入队尾。如果该进程产生新进程,则在队尾再加入 新进程的起始执行地址。简单进程管理器保证每个进程轮流执行,当一个进程 执行了DAT或者执行了0被除的操作则该进程结束。 系统指令包含: DAT MOV ADD SUB JMP JMZ JMN CMP SLT DJN SPL ( 94标准中加入了新的指令: SUB MUL DIV MOD SEQ SNE NOP LDP STP ) Mars机目前你所见到的几乎都是软件模拟系统,模拟器模拟Mars系统工作。 有的模拟器支持88标准,有的支持94标准,有的支持88标准并部分支持94 标准,所以你在选择一个模拟器时应该好好看看它支持那个标准。 Mars机的汇编程序通常称为RedCode,而Mars模拟器几乎都集成了一个RedCode 的编译器,将RedCode程序编译为机器码写入内存。 系统初始时内存中都是DATA $ 0,$ 0 ,每一个程序加载到内存的随机位置 ,当多个程序都加载完后系统给每个程序创建一个进程,此时每个进程在进程 队列中的位置是随机的,然后系统开始运行。然后各个程序开始进行对抗, 看最终谁能生存下来。 <三> RedCode简单语法(按94标准) 指令写法可以记做: <label>OPCODE <OP_modify> <A_modify> A_field,<B_modify> B_field --------------- --------------- 整体记做A 整体记做B <>包含的部分可以省略。 通常A表示源地址,B表示目标地址。 OPCODE包含: DAT 中止进程 MOV 移动数据A到B ADD A加B并将结果存入B SUB A减B并将结果存入B MUL A乘B并将结果存入B DIV B/A并将结果存入B,如果A=0进程结束 MOD B%A并将结果存入B,如果A=0进程结束 JMP 跳转到A JMZ 如果B=0则跳转到A JMN 如果B!=0则跳转到A DJN 先将B减1, 如果B!=0跳转到A SPL 开启一个新进程,新进程起始执行地址为A SLT 如果A<B跳过下一条指令 CMP 和SEQ相同 SEQ 如果A=B跳过下一条指令 SNE 如果A!=B跳过下一条指令 NOP 空指令,什么也不干。 LDP STP 本地地址操作指令,一般都没有实现,这里就不解释了。 DAT 指令可以只有A区域出现,此时一般编译器会将内存的A区域拷贝 一份到B区域。 JMP SPL 指令也可以只有一个A区域出现,此时一般编译器会将内 存的B区域作为$ 0 OP_modify包含: .A 指令读写目的地址的A区域 .B 指令读写目的地址的B区域 (如果Op_modify没有指定,则默认使 用该规则) .AB 指令读A指定地址的A区域,结果写入B指定地址的B区域 .BA 指令读A指定地址的B区域,结果写入B指定地址的A区域 .F 指令读A指定地址的A和B区域,操作结果写入B指定地址的A和B区域 .X 指令读取A指定地址的B区域,操作结果写入B指定地址的A区域; 然后读取A指定地址的A区域,进行同样的操作操作结果写入B指定 地址的B区域 .I 指令读写源和目标地址的整个内存单元。 (mov指令没有指定OP_modify,并且源操作数不是立即数时使用该规则) Modify指定了寻址方式: # 立即数 $ B直接寻址 @ 间接寻址 < B先减1,再间接寻址 > B先减1,再间接寻址 * A间接寻址 { A先减1,再间接寻址 } A先加1,再间接寻址 值得注意的是地址跳转相关的指令A区域不能为立即数,加减乘除模指令的 B区域不能为立即数,否则要么模拟器报语法错误,要么作为执行非法指令中 止进程或者作为空指令处理。 Filed就是指定数据的地方了。 程序注释符为";",从;到行尾均作为注释。但有几个特殊的注释,作为程序信息: ;name filename 指定程序的名字 ;author author 指定程序的作者 ;debug [static|off] 指定是否调试程序,但不是每个模拟器都实现 此外不同的模拟器也有自己特定的特殊符号。 宏一般不同的模拟器都有自己的一套,但通常都实现了EQU,语法 label EQU 表达式 (表达式可以为数字或标签的加减乘除) ORG 数字或标签 指定程序执行的开始地址 END <数字或标签> 程序结束,此后的部分不会被编译,如果指定了一个 数字或标签则作为程序开始地址。 < 四 > 语法实例讲解 以上介绍了整个语法体系,看了后你应该已经云里来雾里去了,我们在这里以 实例讲解RedCode。 以下我们写一个完整的RedCode文件: ;name Test ;author cloud org 1 data dat 5 mov data , @ data mov -2 , < data mov # 3 , data jmp -1 end 编译器编译后将各指令的各个区域写入对应内存单元的对应区域。 假如程序放到内存的0001单元到0005单元 写入内存后反汇编过来就是 0001 DAT $ 5 , $ 5 0002 mov $ -1, @ -1 0003 mov $ -2, < -2 0004 mov # 3 , $ -3 0005 jmp $ -1, > 2 程序入口地址org 1,就是程序的第1条指令开始(编号从0开始), 就是地址0002 0002处mov指令的寻址如下: 源地址: $-1 ,就是直接寻址,以当前地址(0002)相对的-1处的地 址作为源地址 ,即 0001 目的地址: @ -1 ,就是间接寻址,以当前地址(0002)相对的-1处 的地址的B区域作为直接寻址地址 就是0001处的B数据区的数据5作为直接寻址地址,取出0001处的5作为 直接寻址,5也是一个相对地址,相对于0002就是地址0007,最终目标 地址为0007那么最终就是将0001的内存单元拷贝一份到0007 0003处的mov源地址一样,操作的是0001的地址,目标地址为: < -2 ,就是取出相对0003地址-2的地址(就是0001)的B数据区 (就是5),先将其减1(即为4),然后在存放回去(0001处的B数据区变成4) ,将得到的结果(4)作为直接寻址,目标地址就是相对当前地址(0003)为4 的地址,即0007最终结果和上一条指令一样,但真正内存单元拷贝时001 的B数据区已经变成了4 0004处的结果就是把3放到0001的B数据区中 0005处的结果就是把0007的B数据区的数据加1,然后跳转到0006 < 五 > 简单实例 作为对抗程序最重要的就是生存,一个最简单的程序就是 jmp 0 始终跳转到自身,死循环,自己没有攻击能力,唯一取胜的方法就是期望对手 自己死亡,可谓守株待兔。 但这个程序一个问题是自己在内存中的地址固定,很容易收到攻击。 下面这个程序可以说是非常出名的IMP程序了: mov 0,1 它不断把自己移动到下一个内存单元,然后执行到下一个内存单元执行。 这个程序具有一定的攻击能力,能够覆盖别人的程序,但是覆盖他人程序后 也不能取胜,因为不能导致他人程序执行中止进程操作,唯一的取胜方法也 是等待他人程序死亡,但自身在内存中的位置不断移动,生存能力比jmp 0强。 对付IMP程序的方法也很简单: jmp 0 , < -2 这段代码始终跳转到自身,但是跳转前会将前面的第2个内存单元的B数据 区数据减1,当imp程序将自己移动到该地址后将被修改为mov 0,0 这样下次 IMP执行时执行mov0,0没能将自己移动,但执行地址已经到达下一个内存单 元,而Mars系统初始化时内存单元为 dat 0,0 这就导致IMP程序执行一个 DAT指令而导致进程中止。 攻击他人程序通常都是通过扔出一个DAT来覆盖他人程序,使得其他程序因 执行DAT而中止比如下面这个程序: org start dat 0,5 start mov -1,@-1 jmp -1,> -2 end 第一次mov -1 , @ -1 将 dat 0, 5 拷贝一个到相对为5的地址处进行一 次轰炸jmp -1 ,> -2 将 dat 0 ,5 修改为 dat 0,6然后跳转执行 mov -1, @ -1 ,执行mov时导致将dat 0,6 拷贝到相对为6的地址进行轰 炸如此循环,最终将对整个内存以dat轰炸一遍,可谓杀伤力非常。 像这样的轰炸程序是非常有效的攻击,现在的很多程序都是靠这种手法攻击他人, 然后利用IMP的方法移动自己避免被攻击。 当然,你也可以每隔几个单元轰炸一次: org 1 dat 0,5 mov -1,@-1 add #4 , -2 jmp -2 end 这个程序每次将dat 0,5的B数据区加4,然后在MOV处以此寻址进行轰炸, 所有长度大于4的程序都容易受到它的攻击。 作为对抗手段,程序可以采用哨兵概念,先在代码前面放一个数据,然后 检查该数据是否被改变,如果被改变表示其他程序运行到了该处,或者攻 击了该地址,自己就可以采取相应的对策,把自己移动躲避攻击或者发动 对该地址的攻击。 程序对抗非常复杂,你可以到网上多看看别人的程序,这里就不多讲了。 这个地方http://www.koth.org/ 每年都有一次程序大战比赛,你有兴趣 可以去参加。 <六> 如何实战 看到这里是不是心里痒痒想实战一下,写个redcode代码开始作战? 没问题,偶早就给大家准备好了一个Mars虚拟机,这里可以下载: http://www.xfocus.net/tools/200206/程序大战1.0.zip 你得到的是一个.zip压缩包,解开后目录结构如下: ProgBattle.exe 执行程序。 说明.txt 程序大战.txt redcode目录 里边有一些教学用的代码 如何使用?非常简单:运行ProgBattle.exe然后打开你编写的(或网上找到的) redcode程序文件,最后点击“运行”按钮,这些程序便开始在虚拟机内部 开始大战了。比如你打开 redcode\目录下的imp_gate.red和imp.red然后 运行就可以看到我们上一节讲到的imp攻防实例了。redcode目录下的.red文 件都是非常好的作战程序范例,随便找个文件编辑器打开即可,你也可以参 考编写自己的攻击代码。 ProgBattle.exe程序实现了Mars虚拟机88标准和部分94标准,网上找到的 很多程序都可以在里边直接运行,另外该程序还实现了: 反汇编 : Dis按钮; 单步 : 按下“下箭头”按钮,然后点运行按钮; 追踪 : 按下“文本”按钮,这样就可以看到程序运行情况,同时该功能 可以减慢程序运行速度,让你更清楚的 看到作战过程。 暂停 :按下“暂停”按钮。 使用前看看程序目录下的 说明.txt文件 :) < 七 > 相关资料 http://www.koth.org/ 程序大战的老家,你想要的都有。 http://www.koth.org/pmars/ 这里有好几款虚拟机,但都是基本都是Dos界面的。 http://www.koth.org/info.html 这里有相关的文档,和几片教学文档。 watercloud pub www.nsfocus.com 2002-6 1.0版 watercloud pub www.xfocus.net 2003-8 1.1版 增加第<6>节 watercloud [@] xfocus.org |