500万长度的随机序列

2019-04-13 21:59发布生成海报

站内文章 / 模拟电子

9224 0

这是500万长度的随机序列，由A、T、C、G四个字母组成。
这是对应附件得到的结果模式，4的8次幂个八模体及其各自的出现次数。
8模体由8个碱基构成，（碱基即A、T、C、G）每个碱基有4种选择（或A、或T、或C、或G），这样就有4的8次幂种8模体（即65536种）。
附件1中的随机序列包含500万个字符，如果以1为间隔的话，应有4999993个8模体，因为每[i,i+7]位置区域上的8个碱基长的字符串都是一个8模体，i从0开始，直到4999992结束，i是i++逐渐增加的，附件2的结果就是在以1为间隔下得到的。4999993个8模体由65536种8模体组成，附件2中的结果就是在4999993个8模体中每种8模体出现了多少次。
如果以2为间隔的话，应有2499996个8模体，因为每[i,i+7]位置区域上的8个碱基长的字符串都是一个8模体，i从0开始，直到4999992结束，i是i+=2逐渐增加的。
如果以k为间隔的话，应有500万除k个8模体，因为每[i,i+7]位置区域上的8个碱基长的字符串都是一个8模体，i从0开始，i是i+=k逐渐增加的，直到i+7>4999999结束。
现在我能计算以1为间隔的，但以k为间隔的程序实在弄不出来。我是学物理的学生，计算机这块有些棘手，麻烦各位了。
这是统计以1为间隔的程序:

#include 

#define N_A 9
#define N_B (1u<<(2*N_A))

int main()
{
    static unsigned long octamer_count[N_B] = { 0 };    //当跑八模体以上时，因为数据量已经很大，要价个static,八模体以下不用它

    ////// 1 //////
    {
        FILE* file = fopen( "E:\酵母\光学与信息学\碱基随机.txt", "rb" );
        if( !file )
        {
            puts( "cannot open the input file.");
            return 1;
        }
        {
            unsigned long octamer;
            unsigned long octamer_n = 0;
            char c;
            for( ; fread(&c,1,1,file)==1; )
            {
                switch( c )
                {
                    case 'A':
                        octamer = (octamer*4+0)%N_B; ++octamer_n; break;
                    case 'T':
                        octamer = (octamer*4+1)%N_B; ++octamer_n; break;
                    case 'C':
                        octamer = (octamer*4+2)%N_B; ++octamer_n; break;
                    case 'G':
                        octamer = (octamer*4+3)%N_B; ++octamer_n; break;
                    case '
':
                    case '
':
                        continue;
                    default:
                        puts( "Fuck" );
                    case 'N':
                        octamer_n = 0;
                        continue;
                }
                if( octamer_n < N_A )
                    continue;
                octamer_n = N_A;

                ++octamer_count[octamer];
            }
        }
        fclose( file );
    }

    ////// 2 //////
    {
        FILE* fileout = fopen( "E:\酵母\光学与信息学\碱基随机9模体.txt", "wt" );
        if( !fileout )
        {
            puts( "cannot open the output file.");
            return 2;
        }
        {
            unsigned int i, j;
            for( i=0; i


                         
                         
     
  
      Ta的文章  更多 >> 
             
      


                    
          D-Bus资料汇总
               
                0 个评论
               
              
                              
          500万长度的随机序列
               
                0 个评论
               
              
                               

              
                  
  

  
  
    
         
  
      热门文章


      



  
    
      
      举报内容
    
    






检举类型


检举内容


检举用户




检举原因



广告推广


恶意灌水


回答内容与提问无关



抄袭答案


其他





检举说明(必填)






    

                
                 
      



    

  


 打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮
 

 





   


  
    
    



      
      
       
  
      




  
             
            
                    Copyright © 2025 平头弟 京ICP备15032243号-1
                         投诉举报邮箱：nettui@qq.com

500万长度的随机序列

Ta的文章 更多 >>

热门文章

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

Ta的文章更多 >>