分布式¶
FLAGS_communicator_fake_rpc¶
(始于 1.5.0)
当设为 True 时,通信器不会实际进行 rpc 调用,因此速度不会受到网络通信的影响。该 flag 用于调试。
取值范围¶
Bool 型,缺省值为 False。
示例¶
FLAGS_communicator_fake_rpc=True - 启用通信器 fake 模式。
注意¶
该 flag 仅用于 paddlepaddle 的开发者,普通用户不应对其设置。
FLAGS_communicator_independent_recv_thread¶
(始于 1.5.0)
使用独立线程以从参数服务器接收参数。
取值范围¶
Bool 型,缺省值为 True。
示例¶
FLAGS_communicator_independent_recv_thread=True - 使用独立线程以从参数服务器接收参数。
注意¶
开发者使用该 flag 进行框架的调试与优化,普通用户不应对其设置。
FLAGS_communicator_max_merge_var_num¶
(始于 1.5.0)
要通过通信器合并为一个梯度并发送的最大梯度数。训练器将所有梯度放入队列,然后通信器将从队列中取出梯度并在合并后发送。
取值范围¶
Int32 型,缺省值为 20。
示例¶
FLAGS_communicator_max_merge_var_num=16 - 将要通过通信器合并为一个梯度并发送的最大梯度数设为 16。
注意¶
该 flag 和训练器线程数有着密切关联,缺省值应和线程数一致。
FLAGS_communicator_merge_sparse_grad¶
(始于 1.5.0)
在发送之前,合并稀疏梯度。
取值范围¶
Bool 型,缺省值 true。
示例¶
FLAGS_communicator_merge_sparse_grad=true - 设置合并稀疏梯度。
注意¶
合并稀疏梯度会耗费时间。如果重复 ID 较多,内存占用会变少,通信会变快;如果重复 ID 较少,则并不会节约内存。
FLAGS_communicator_min_send_grad_num_before_recv¶
(始于 1.5.0)
在通信器中,有一个发送线程向参数服务器发送梯度,一个接收线程从参数服务器接收参数,且它们之间彼此独立。该 flag 用于控制接收线程的频率。 仅当发送线程至少发送 FLAGS_communicator_min_send_grad_num_before_recv 数量的梯度时,接收线程才会从参数服务器接收参数。
取值范围¶
Int32 型,缺省值为 20。
示例¶
FLAGS_communicator_min_send_grad_num_before_recv=10 - 在接收线程从参数服务器接收参数之前,发送线程发送的梯度数为 10。
注意¶
由于该 flag 和训练器的训练线程数强相关,而每个训练线程都会发送其梯度,所以缺省值应和线程数一致。
FLAGS_communicator_send_queue_size¶
(始于 1.5.0)
每个梯度的队列大小。训练器将梯度放入队列,然后通信器将其从队列中取出并发送出去。 当通信器很慢时,队列可能会满,训练器在队列有空间之前被持续阻塞。它用于避免训练比通信快得多,以致太多的梯度没有及时发出的情况。
取值范围¶
Int32 型,缺省值为 20。
示例¶
FLAGS_communicator_send_queue_size=10 - 设置每个梯度的队列大小为 10。
注意¶
该 flag 会影响训练速度,若队列大小过大,速度会变快但结果可能会变差。
FLAGS_communicator_send_wait_times¶
(始于 1.5.0)
合并数没有达到 max_merge_var_num 的情况下发送线程等待的次数。
取值范围¶
Int32 型,缺省值为 5。
示例¶
FLAGS_communicator_send_wait_times=5 - 将合并数没有达到 max_merge_var_num 的情况下发送线程等待的次数设为 5。
FLAGS_communicator_thread_pool_size¶
(始于 1.5.0)
设置用于发送梯度和接收参数的线程池大小。
取值范围¶
Int32 型,缺省值为 5。
示例¶
FLAGS_communicator_thread_pool_size=10 - 设置线程池大小为 10。
注意¶
大部分情况下,用户不需要设置该 flag。
FLAGS_dist_threadpool_size¶
(始于 1.0.0)
控制用于分布式模块的线程数。如果未设置,则将其设置为硬线程。
取值范围¶
Int32 型,缺省值为 0。
示例¶
FLAGS_dist_threadpool_size=10 - 将用于分布式模块的最大线程数设为 10。
FLAGS_rpc_deadline¶
(始于 1.0.0)
它控制 rpc 通信的 deadline 超时。
取值范围¶
Int32 型,缺省值为 180000,单位为 ms。
示例¶
FLAGS_rpc_deadline=180000 - 将 deadline 超时设为 3 分钟。
FLAGS_rpc_disable_reuse_port¶
(始于 1.2.0)
FLAGS_rpc_disable_reuse_port 为 True 时,grpc 的 GRPC_ARG_ALLOW_REUSEPORT 会被设置为 False 以禁用 SO_REUSEPORT。
取值范围¶
Bool 型,缺省值为 False。
示例¶
FLAGS_rpc_disable_reuse_port=True - 禁用 SO_REUSEPORT。
FLAGS_rpc_get_thread_num¶
(始于 1.0.0)
它控制用于从参数服务器获取参数的线程数。
取值范围¶
Int32 型,缺省值为 12。
示例¶
FLAGS_rpc_get_thread_num=6 - 将从参数服务器获取参数的线程数设为 6。
FLAGS_rpc_send_thread_num¶
(始于 1.0.0)
它控制用于发送 rpc 的线程数。
取值范围¶
Int32 型,缺省值为 12。
示例¶
FLAGS_rpc_send_thread_num=6 - 将用于发送的线程数设为 6。
FLAGS_rpc_server_profile_path¶
since(v0.15.0)
设置分析器输出日志文件路径前缀。完整路径为 FLAGS_rpc_server_profile_path_listener_id,其中 listener_id 为随机数。
取值范围¶
String 型,缺省值为"./profile_ps"。
示例¶
FLAGS_rpc_server_profile_path="/tmp/pserver_profile_log" - 在"/tmp/pserver_profile_log_listener_id"中生成配置日志文件。