transpose code

#include 
#include "gputimer.h"

const int N=1024;

void
transpose_CPU(float in[], float out[])
{
	for(int j=0; j < N; j++)
		for(int i=0; i