提交记录 13634


用户 题目 状态 得分 用时 内存 语言 代码长度
fjzzq2002 mmmd1k. 测测你的双精度矩阵乘法-1k Accepted 100 613.666 ms 8232 KB C++ 912 B
提交时间 评测时间
2020-08-05 20:06:18 2020-08-05 20:06:21
#define BLOCK_SIZE_L1 32
#define BLOCK_SIZE_L2 64
#define BLOCK_SIZE_L3 128
#define MIN(a,b) ((a)<(b)?(a):(b))
void matrix_multiply(int n,const double* B,const double* A,double* C)
{
	__attribute__((aligned(64))) double c[BLOCK_SIZE_L1][BLOCK_SIZE_L3];
	for(int ii=0;ii<n;ii+=BLOCK_SIZE_L3)
		for(int kk=0;kk<n;kk+=BLOCK_SIZE_L1)
		{
			int ui=MIN(n-ii,BLOCK_SIZE_L3);
			int uk=MIN(n-kk,BLOCK_SIZE_L1);
			for(int k=0;k<uk;++k)
				for(int i=0;i<ui;++i) c[k][i]=0;
			for(int jj=0;jj<n;jj+=BLOCK_SIZE_L2)
			{
				const double*__restrict__ bb=B+jj+kk*n;
				const double*__restrict__ aa=A+ii+jj*n;
				int uj=MIN(n-jj,BLOCK_SIZE_L2);
				int ui=MIN(n-ii,BLOCK_SIZE_L3);
				for(int k=0;k<uk;++k)
					for(int j=0;j<uj;j++)
						for(int i=0;i<ui;i++)
							c[k][i]+=aa[i+j*n]*bb[j+k*n];
			}
			double*__restrict__ cc=C+ii+kk*n;
			for(int k=0;k<uk;++k)
				for(int i=0;i<ui;++i)
					cc[i+k*n]+=c[k][i];
		}
}

CompilationN/AN/ACompile OKScore: N/A

Testcase #1613.666 ms8 MB + 40 KBAcceptedScore: 100


Judge Duck Online | 评测鸭在线
Server Time: 2026-03-24 00:31:55 | Loaded in 1 ms | Server Status
个人娱乐项目,仅供学习交流使用 | 捐赠