OGeek|极客世界-中国程序员成长平台

标题: ios - vImage 与具有 dispatch_apply 的正常循环具有相同的性能 [打印本页]

作者: 菜鸟教程小白    时间: 2022-12-13 08:55
标题: ios - vImage 与具有 dispatch_apply 的正常循环具有相同的性能

这段代码每次都在嵌套循环中运行 9600 次,并且在 iPhone4S 上运行的总时间必须少于 30 毫秒:

vImage_Buffer source = { sourceArea.data, patchSide, patchSide, patchSide };
vImage_Buffer destination = { (uchar*)malloc(patchSide * patchSide * sizeof(uchar)), patchSide, patchSide, patchSide };
vImage_AffineTransform transform = { warpingMatrix(0,0), warpingMatrix(0,1), warpingMatrix(1,0), warpingMatrix(1,1), 0, 0 };

if (vImageAffineWarp_Planar8(&source, &destination, NULL, &transform, 0, kvImageBackgroundColorFill) != kvImageNoError)
{
    NSLog(@"Error in warping!");
}

它似乎没有那么快,因为一个 10x10 的补丁大约需要 0.0002 秒。我是否忽略了一些重大的性能错误?

我要解决的问题是匹配向后扭曲的图像,这是第一步。补丁在围绕一个点的 64 个不同位置被扭曲 64 次,每个点最多 150 个点。



Best Answer-推荐答案


10x10 是一个非常小的图像。您很容易将大部分时间花在开销/malloc 上。仪器时间跟踪应该有助于确定时间的去向。

4s 上的向量 ALU 也是 5s 或 5s 宽度的一半,因此不能提供太多胜过标量的能力。

关于ios - vImage 与具有 dispatch_apply 的正常循环具有相同的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25337267/






欢迎光临 OGeek|极客世界-中国程序员成长平台 (https://ogeek.cn/) Powered by Discuz! X3.4