优化实验 Optimize( 三 ) _生活百科

分块优化分块，使每次运算的数据恰好填满cache line，从而减少cache miss 。
register int i, j;register int i_, j_;register int i__, j__;int block = 8;// 8 * 8 = 64 = cache linefor(i = 1; i < HEIGHT - 1; i += block){ for(j = 1; j < WIDTH - 1; j += block) {i__ = minn(HEIGHT - 1, i + block);j__ = minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}} }}多线程优化利用CPU多核的特点，将任务分为多个子任务。
这里使用C语言pthread库。优化效果显著！

点击查看代码

#include <stdio.h>#include <stdlib.h>#include <pthread.h>#include <time.h>#define PTHREAD_NUM 6//线程总数#define RECNUM 100 typedef struct{int l;int r;}PTH_ARGV;//线程参数结构体typedef struct{int a;}PTH_RETURN;//线程返回值结构体#define HEIGHT 1080#define WIDTH 1920long img[HEIGHT][WIDTH];int maxn(int x, int y){	if(x >= y)	{return x;	}else	{return y;	}}int minn(int x, int y){	if(x >= y)	{return y;	}else	{return x;	}}void *func(void *argv)//线程函数体{PTH_ARGV *pth_argv;PTH_RETURN *pth_return = malloc(sizeof(PTH_RETURN));//为返回值申请空间pth_argv = (PTH_ARGV*)argv;//将参数强转为参数结构体{//线程要做的事情register int i, j;register int i_, j_;register int i__, j__;int block = 8;// 8 * 8 = 64 = cache linefor(i = pth_argv->l; i < pth_argv->r; i += block){for(j = 1; j < WIDTH - 1; j += block){i__ = minn(pth_argv->r, i + block);j__ = minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}}}}}free(argv);//释放线程参数空间/*void pthread_exit(void *retval);描述：线程终止；类似于exit，exit是进程终止，两者差距在于结束的对象不同 。参数：retval -- 要带回的值,可以为NULL，如果为NULL，则不需要线程返回值结构体，母线程也不会收到子线程的返回值*/pthread_exit(pth_return);//线程结束，返回母线程需要的返回值 ， }int main(){pthread_t pd[PTHREAD_NUM];//pidPTH_ARGV *pth_argv;//线程参数//PTH_RETURN *pth_return;//线程返回值int cnt = RECNUM;clock_t t1, t2;	t1 = clock();while(cnt --){int i;for(i = 0;i < PTHREAD_NUM;i ++){//为线程参数申请空间（注：为什么要申请空间？因为不申请空间，所有线程公用同意参数空间，很可能发生线程间的抢占效果），此函数需要由子线程释放掉pth_argv = malloc(sizeof(PTH_ARGV));{//对线程参数结构体进行初始化pth_argv->l = maxn(1, i * HEIGHT / PTHREAD_NUM);pth_argv->r = minn(HEIGHT - 1, (i + 1) * HEIGHT / PTHREAD_NUM);}/*int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);描述：创建一个线程 。返回值：成功返回0，失败返回一个错误编号 。参数：thread -- 回填创建的线程的PID 。attr -- 特殊要求 。默认为NULL.start_routine --被创建的线程所执行的函数 。void *(*start_routine) (void *)arg -- start_routine函数的传参 。*/pthread_create(pd + i,NULL,func,pth_argv);//创建线程}for(i = 0;i<PTHREAD_NUM;i++){/*int pthread_join(pthread_t thread, void **retval);描述：给线程号为thread的线程收尸(线程结束后会变成僵尸线程（不占用空间 ， 但占用线程号），父线程需要等待子线程结束，然后释放掉线程的线程号） ， 一般是谁创建谁收尸（不是铁律，线程之间平等），可以起到阻塞非盲等的状态 。返回值：成功时返回 0；出错时 ， 它返回一个错误编号 。参数：thread -- 线程IDretval -- 回填PID为thread的线程的的返回值，可以为NULL，为NULL时，父线程将不在接收到子线程回传的返回值 。*///pthread_join(pd[i],(void **)&pth_return);//等待线程结束pthread_join(pd[i],NULL);//等待线程结束//free(pth_return);//释放掉线程返回值结构体}	}t2 = clock();printf("COST %ldms\n",(t2 - t1) * 1000 / CLOCKS_PER_SEC);return 0;}

多进程优化也是没有明显的优化效果。

void Func6(){	register int i, j;	register int i_, j_;	register int i__, j__;	int block = 8;int id = fork();	if(id == 0)	{for(i = 1; i < HEIGHT / 2; i += block){for(j = 1; j < WIDTH - 1; j += block){i__ = minn(HEIGHT / 2, i + block);j__ = minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}}}}exit(0);	}	else	{for(i = HEIGHT / 2; i < HEIGHT - 1; i += block){for(j = 1; j < WIDTH - 1; j += block){i__ = minn(HEIGHT - 1, i + block);j__	= minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}}}}	}}
上一页
1
2
3
4
下一页
		  	

    
    




    
    
    


推荐阅读

           
                  
              
                  饭圈拉瓜是什么意思 饭圈拉郎是什么意思 
                
                   
                
              
            

                  
              
                  山药圆子怎么做才好吃，肉末山药圆子的做法？ 
                
                   
                
              
            

                  
              
                  父母买房可以写未成年孩子的名字吗,规避转让税但不能贷款 
                
                   
                
              
            

                  
              
                  不倒翁小鸟的制作教程 
                
                   
                
              
            

                  
              
                  “魑魅魍魉” 你们知道怎么读吗？ 魑魅魍魉怎么读 
                
                   
                
              
            

                  
              
                  关于淮北公交简述 淮北公交 
                
                   
                
              
            

                  
              
                  excel查找不出来是什么原因 
                
                   
                
              
            

                  
              
                  强势老人是家庭的灾难【老人强势发生家庭矛盾】 
                
                   
                
              
            

                  
              
                  糖尿病人适合送的礼品 女总裁给男秘书送粥 
                
                   
                
              
            

                  
              
                  大红袍分几种肉桂 
                
                   
                
              
            

                  
              
                  熟黄芪泡水喝的功效与作用 熟黄芪泡水喝有哪些功效与作用 
                
                   
                
              
            

                  
              
                  柠檬片的功能与功效  柠檬片的功效作用 
                
                   
                
              
            

                  
              
                  防弹咖啡怎么做好喝  防弹咖啡怎么做 
                
                   
                
              
            

                  
              
                  今年广东调整养老金的新消息 2022广东省养老金上调方案及补发时间 
                
                   
                
              
            

                  
              
                  昆明机场离哪个高铁站近，昆明飞机场到高铁站有多远？ 
                
                   
                
              
            

                  
              
                  孕妇铅过高有什么症状 有什么不良影响 
                
                   
                
              
            

                  
              
                  毓字取名女孩有寓意属兔最搭的名字有哪些？ 
                
                   
                
              
            

                  
              
                  关于特别认真地生活简述 特别认真地生活 
                
                   
                
              
            

                  
              
                  办银行卡需要什么 办银行卡需要什么证件和材料 
                
                   
                
              
            

                  
              
                  终不似少年游 终不似少年游 
                
                   
                
              
            

          

dp优化 | 各种dp优化方式例题精选 

基于PL022 SPI 控制器 海思3516系列芯片SPI速率慢问题深入分析与优化 

二 网络工程知识VLAN的基础和配置：802.1q帧；Access、Trunk、Hybrid接口工作模式过程与配置；VLANIF的小实验 

京东云TiDB SQL优化的最佳实践 

Mysql单表访问方法，索引合并，多表连接原理，基于规则的优化，子查询优化 

NodeJS 服务 Docker 镜像极致优化指北 

如何做谷歌SEO优化 淘宝谷歌搜索优化 

AVX图像算法优化系列二: 使用AVX2指令集加速查表算法。 

Apache Dolphin Scheduler 3.0.1 发布，对核心及UI相关进行优化 

AVX图像算法优化系列一: 初步接触AVX。