内核函数里能否使用malloc函数
cuda吧
全部回复
仅看楼主
level 1
123西北角 楼主

大家好,小弟最近刚开始接触cuda编程,现在身边没有实验环境,我想问下内核函数里能否使用malloc函数?
另外,我想每个block都从global
memory中各自读取一个大概1M的矩阵,利用多线程将这个矩阵读到share memory中,可是每个multiprocessor的share
memory只有16k,我应该怎么解决才好呢?如果一个块只有一个线程,那从global
memory中直接读取1M的数据,其latency大概是多少?
第三个问题,哪里可以下载到处理十分巨大的数据量的cuda程序?
烦请各位大哥帮忙,小弟感激不尽,这些天被这些东西实在烦得不行。

2012年02月05日 08点02分 1
level 1
CUDA什么的不知道了,这吧根本没人,去opengpu论坛去问吧[大笑]
2012年02月13日 06点02分 2
what[疑问]
2013年08月28日 12点08分
level 11
貌似
lz
刚刚接触cuda
2012年02月13日 16点02分 3
level 1
用cudaMalloc
2012年03月27日 13点03分 5
+1
2012年11月18日 17点11分
level 8
计算能力2.0以上的卡,在kernel函数里可以使用malloc函数
2013年08月16日 01点08分 6
1