我不知道怎么用,我已经从hwloc检索到的物理ID。 例如,我看到以下,但如果我把rank 0=10.0.2.4 slot=1:8
的rankfile我得到一个错误8
不存在。 然而, rank 0=10.0.2.4 slot=1:p8
没有问题,运行,但我不知道是否我引用PU#8
或Core P#8
。 如何绑定到任何一个特定的核心或使用rankfile特定的硬件线程? 有没有一些方法,我可以调试呢?
[hamiltont@4 latency]$ hwloc-ls -p
Machine (36GB)
NUMANode P#0 (18GB) + Socket P#1 + L3 (12MB)
L2 (256KB) + L1 (32KB) + Core P#0
PU P#0
PU P#12
L2 (256KB) + L1 (32KB) + Core P#1
PU P#2
PU P#14
L2 (256KB) + L1 (32KB) + Core P#2
PU P#4
PU P#16
L2 (256KB) + L1 (32KB) + Core P#8
PU P#6
PU P#18
L2 (256KB) + L1 (32KB) + Core P#9
PU P#8
PU P#20
L2 (256KB) + L1 (32KB) + Core P#10
PU P#10
PU P#22
NUMANode P#1 (18GB) + Socket P#0 + L3 (12MB)
L2 (256KB) + L1 (32KB) + Core P#0
PU P#1
PU P#13
L2 (256KB) + L1 (32KB) + Core P#1
PU P#3
PU P#15
L2 (256KB) + L1 (32KB) + Core P#2
PU P#5
PU P#17
L2 (256KB) + L1 (32KB) + Core P#8
PU P#7
PU P#19
L2 (256KB) + L1 (32KB) + Core P#9
PU P#9
PU P#21
L2 (256KB) + L1 (32KB) + Core P#10
PU P#11
PU P#23
我认为这个问题是相当接近我问什么我,但并不完全一样。