其他¶
FLAGS_benchmark¶
(始于 0.12.0)
用于基准测试。设置后,它将使局域删除同步,添加一些内存使用日志,并在内核启动后同步所有 cuda 内核。
取值范围¶
Bool 型,缺省值为 False。
示例¶
FLAGS_benchmark=True - 同步以测试基准。
FLAGS_inner_op_parallelism¶
(始于 1.3.0)
大多数 Operators 都在单线程模式下工作,但对于某些 Operators,使用多线程更合适。 例如,优化稀疏梯度的优化 Op 使用多线程工作会更快。该 flag 用于设置 Op 内的线程数。
取值范围¶
Int32 型,缺省值为 0,这意味着 operator 将不会在多线程模式下运行。
示例¶
FLAGS_inner_op_parallelism=5 - 将 operator 内的线程数设为 5。
注意¶
目前只有稀疏的 adam op 支持 inner_op_parallelism。
FLAGS_max_body_size¶
(始于 1.0.0)
控制 BRPC 中的最大消息大小。
取值范围¶
Int32 型,缺省值为 2147483647。
示例¶
FLAGS_max_body_size=2147483647 - 将 BRPC 消息大小设为 2147483647。