Blame: python/paddle/distributed/io.py - PaddlePaddle/Paddle

PaddlePaddle / Paddle UNCLAIMED

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice （『飞桨』核心框架，深度学习&机器学习高性能单机、分布式训练和跨平台部署）

0 0 1 C++

Normal View History Raw

[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`# Copyright (c) 2022 PaddlePaddle Authors. All Rights Reserved.`
			`#`
			`# Licensed under the Apache License, Version 2.0 (the "License");`
			`# you may not use this file except in compliance with the License.`
			`# You may obtain a copy of the License at`
			`#`
			`# http://www.apache.org/licenses/LICENSE-2.0`
			`#`
			`# Unless required by applicable law or agreed to in writing, software`
			`# distributed under the License is distributed on an "AS IS" BASIS,`
			`# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.`
			`# See the License for the specific language governing permissions and`
			`# limitations under the License.`

			`import os`

			`import paddle`
【Fluid Clean】 Rename paddle.fluid to paddle.base (#56576) * rename fluid to base * fix setup and rename paddle.fluid * fix protobuf generated paddle.fluid * fix some errors * fix cmake depends * fix some error * try to fix cache error * fix codestyle && some doc error * remove build change * fix some error --------- Co-authored-by: XiangGao <jeff41404@gmail.com> 2023-09-07 17:26:19 +08:00			`from paddle.base.framework import Program, static_only`
[CodeStyle][isort] introduce isort (part4) (#48402) * isort all files * revert conflicting files * revert conflicting files * revert conflicting files 2022-11-29 18:50:04 +08:00			`from paddle.framework import core, dygraph_not_support`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00

[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00			`def _load_distributed_persistables(executor, dirname, main_program=None):`
			`"""`
			`customized load_persistables for distributed training.`
			`it should be used on parameter server,`

			`Args:`
			`executor(Executor): The executor to run for saving parameters.`
			`dirname(str): The load directory path.`
			`main_program(Program): The program whose parameters will be`
			`loaded. the main_program must be the pserver_program`
			`get after transpiler.`

			`Returns:`
			`None`

			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> # doctest: +REQUIRES(env: DISTRIBUTED)`
			`>>> import paddle`
			`>>> import paddle.base as base`

			`>>> paddle.enable_static()`
			`>>> exe = base.Executor(base.CPUPlace())`
			`>>> param_path = "./my_paddle_model"`
			`>>> t = paddle.distributed.transpiler.DistributeTranspiler()`
			`>>> t.transpile(...)`
			`>>> pserver_prog = t.get_pserver_program(...)`
			`>>> _load_distributed_persistables(executor=exe, dirname=param_path, main_program=pserver_prog)`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00			`"""`

			`def __is_distributed_part_var(varname):`
			`trainer_idx = varname.find(".trainer_")`
			`block_idx = varname.find(".block")`
			`return trainer_idx or block_idx`

			`def __load_persistable_vars(executor, dirname, need_load_vars):`
			`load_prog = Program()`
			`load_block = load_prog.global_block()`
			`need_delete_vars = []`

			`for param in need_load_vars:`
			`origin_var = param.origin`
			`slice_var = param.slice`
			`is_slice = param.is_slice`
			`offset = param.offset`

			`if is_slice:`
			`slice = load_block.create_var(`
			`name=slice_var.name,`
			`type=slice_var.type,`
			`shape=slice_var.shape,`
			`dtype=slice_var.dtype,`
			`persistable=True,`
			`)`

			`load_block.append_op(`
			`type='load',`
			`inputs={},`
			`outputs={'Out': [slice]},`
			`attrs={`
			`'file_path': os.path.join(dirname, origin_var.name),`
			`'seek': offset,`
			`'shape': slice.shape,`
			`},`
			`)`
			`else:`
			`origin = load_block.create_var(`
[CodeStyle][UP030][UP031][UP032] using f-string (#52062) * autofix Co-authored-by: Liyulingyue <83450930+Liyulingyue@users.noreply.github.com> * revert changes in python/paddle/distributed/fleet/utils/hybrid_parallel_util.py * empty commit, trigger ci * fix test_slice --------- Co-authored-by: SigureMo <sigure.qaq@gmail.com> 2023-03-31 10:11:56 +08:00			`name=f"{origin_var.name}",`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00			`type=origin_var.type,`
			`shape=origin_var.shape,`
			`dtype=origin_var.dtype,`
			`persistable=True,`
			`)`
			`load_block.append_op(`
			`type='load',`
			`inputs={},`
			`outputs={'Out': [origin]},`
			`attrs={'file_path': os.path.join(dirname, origin_var.name)},`
			`)`

			`executor.run(load_prog)`

			`if not isinstance(main_program, Program):`
			`raise TypeError("'main_program' should be an instance of Program.")`

			`if not main_program._is_distributed:`
			`raise ValueError(`
			`"'_load_distributed_persistables' just be designed for distributed training."`
			`)`

			`if not main_program._ps_endpoint:`
			`raise ValueError(`
			`"'_load_distributed_persistables' need current_endpoint set in DistributeTranspiler.transpile"`
			`)`

			`need_load_vars = (`
			`main_program._parameters_on_pservers.get_distributed_vars_by_ep(`
			`main_program._ps_endpoint`
			`)`
			`)`
			`__load_persistable_vars(executor, dirname, need_load_vars)`


			`@dygraph_not_support`
			`def load_persistables(executor, dirname, main_program=None, filename=None):`
			`"""`
			`:api_attr: Static Graph`

			This API filters out all variables with ``persistable==True`` from the
			given ``main_program`` and then tries to load these variables from the
			directory ``dirname`` or the file ``filename``.

			Use the ``dirname`` to specify the directory where persistable variables
			(refer to :ref:`api_guide_model_save_reader_en`) were saved. If variables
			were saved in separate files, set ``filename`` as None; if all variables
			were saved in a single file, use ``filename`` to specify the file name.

			`Args:`
			`executor(Executor): The executor used for loading persistable variables.`
			See :ref:`api_guide_executor_en` for more details about it.
			`dirname(str): The directory path.`
			`main_program(Program, optional): The program whose persistable variables will`
			be loaded. If it is None, the ``default_main_program``
			will be used automatically. See :ref:`api_guide_Program_en`
			for more about ``Program``.
			`Default: None.`
			`filename(str, optional): The file which saved all persistable variables. If variables`
			`were saved in separated files, set it to None.`
			`Default: None.`

			`Returns:`
			`None`

			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> import paddle`
			`>>> import paddle.base as base`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> paddle.enable_static()`
			`>>> exe = base.Executor(base.CPUPlace())`
			`>>> param_path = "./my_paddle_model"`
			`>>> prog = base.default_main_program()`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> paddle.distributed.io.load_persistables(`
			`... executor=exe,`
			`... dirname=param_path,`
			`... main_program=None,`
			`... )`
[Fluid Clean]Move and Remove some io API in Fluid (#50842) * move io * fix ci bugs * fix ci bugs * fix py3 bugs * fix example code * fix example code * fix text * fix text * deal with ci bugs * perfect code according comment * delete import batch 2023-03-08 10:36:50 +08:00			`"""`

			`if main_program and main_program._is_distributed:`
			`_load_distributed_persistables(`
			`executor, dirname=dirname, main_program=main_program`
			`)`
			`else:`
			`paddle.static.io.load_vars(`
			`executor,`
			`dirname=dirname,`
			`main_program=main_program,`
			`predicate=is_persistable,`
			`filename=filename,`
			`)`


[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`def _save_distributed_persistables(executor, dirname, main_program):`
			`"""`
			`save_persistables for distributed training.`
			`the method will do things listed below:`
			`1.save part of persistable variables on trainer.`
			`2.receive "remote prefetch variables" from parameter servers and merge them.`
			`3.save "distributed lookup table" on parameter servers.`
			`4.receive "optimizer variables" from parameter servers and merge them.`

			`Args:`
			`executor(Executor): The executor to run for saving parameters.`
			`dirname(str): The saving directory path.`
			`main_program(Program): The program whose parameters will be`
			`saved. the main_program must be the trainer_program`
			`get after transpiler.`

			`Returns:`
			`None`

			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> # doctest: +REQUIRES(env: DISTRIBUTED)`
			`>>> import paddle`
			`>>> import paddle`

			`>>> paddle.enable_static()`
			`>>> exe = paddle.static.Executor(paddle.CPUPlace())`
			`>>> param_path = "./my_paddle_model"`
			`>>> t = paddle.distributed.transpiler.DistributeTranspiler()`
			`>>> t.transpile(...)`
			`>>> train_program = t.get_trainer_program()`
			`>>> _save_distributed_persistables(executor=exe, dirname=param_path, main_program=train_program)`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`"""`

			`def __save_remote_params(executor, dirname, remote_params_map):`
			`"""`
			`receive params on pserver through rpc.`
			`if the params are be sliced, will concat them to one, then save it.`
			`"""`
			`if not remote_params_map:`
			`return`

			`prog = paddle.static.Program()`
			`block = prog.global_block()`

			`# recv optimize vars from pserver`
			`for name, remote_params in remote_params_map.items():`
			`origin = remote_params[0].origin`
			`is_slice = remote_params[0].is_slice`

			`slices = [None] * len(remote_params)`
			`slice_varnames = [None] * len(remote_params)`
			`remote_varnames = [None] * len(remote_params)`
			`endpoints = [None] * len(remote_params)`

			`for idx, optimizer in enumerate(remote_params):`
			`block_id = optimizer.block_id`
			`slice = optimizer.slice`
			`endpoint = optimizer.endpoint`

			`index = block_id if is_slice else idx`
			`slices[index] = slice`
[CodeStyle][UP030][UP031][UP032] using f-string (#52062) * autofix Co-authored-by: Liyulingyue <83450930+Liyulingyue@users.noreply.github.com> * revert changes in python/paddle/distributed/fleet/utils/hybrid_parallel_util.py * empty commit, trigger ci * fix test_slice --------- Co-authored-by: SigureMo <sigure.qaq@gmail.com> 2023-03-31 10:11:56 +08:00			`slice_varnames[index] = f"{slice.name}.slice.{idx}"`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`remote_varnames[index] = slice.name`
			`endpoints[index] = endpoint`

			`slice_shapes = []`
			`for slice in slices:`
			`tmp = [str(dim) for dim in slice.shape]`
			`slice_shapes.append(",".join(tmp))`

			`block.append_op(`
			`type='recv_save',`
			`attrs={`
			`"trainer_id": 0,`
			`"shape": origin.shape,`
			`"slice_shapes": slice_shapes,`
			`"slice_varnames": slice_varnames,`
			`"remote_varnames": remote_varnames,`
			`"endpoints": endpoints,`
			`"file_path": os.path.join(dirname, origin.name),`
			`},`
			`)`

			`executor.run(prog)`

			`def __save_distributed_lookup_tables(`
			`executor, dirname, distributed_lookup_table, endpoints`
			`):`
			`"""`
			`because the distributed lookup table may too huge to merge and save at one place,`
			`it will be saved at parameter server independent respectively.`

			`the save directory is dirname/"__lookup_table__".`

			`"""`
			`prog = paddle.static.Program()`
			`block = prog.global_block()`

			`# if there is lookup table, the trainer 0 will notify all pserver to save.`
			`lookup_table_filename = os.path.join(dirname, "__lookup_table__")`
			`attrs = {}`
			`attrs['epmap'] = endpoints`
			`attrs['dir'] = lookup_table_filename`
			`attrs['lookup_table'] = distributed_lookup_table`
			`block.append_op(`
			`type='checkpoint_notify', inputs={}, outputs={}, attrs=attrs`
			`)`
			`executor.run(prog)`

			`def __exclude_vars(exclude_var_names=[]):`
			`def is_valid(var):`
			`if var.name in exclude_var_names:`
			`return False`
			`if (`
			`var.desc.type() == core.VarDesc.VarType.FEED_MINIBATCH`
			`or var.desc.type() == core.VarDesc.VarType.FETCH_LIST`
			`or var.desc.type() == core.VarDesc.VarType.READER`
			`):`
			`return False`
			`return var.persistable`

			`return is_valid`

			`if not isinstance(main_program, Program):`
			`raise TypeError("'main_program' should be an instance of Program.")`

			`if not main_program._is_distributed:`
			`raise ValueError(`
			`"'_save_distributed_persistables' just be designed for distributed training."`
			`)`

			`remote_params_map = (`
			`main_program._parameters_on_pservers.get_distributed_vars_by_vtypes(`
			`["Optimizer", "RemotePrefetch"], groupby=True`
			`)`
			`)`

			`exclude_var_names = []`
			`if remote_params_map:`
			`exclude_var_names.extend(remote_params_map.keys())`

			`if main_program._distributed_lookup_table:`
			`if isinstance(main_program._distributed_lookup_table, list):`
			`exclude_var_names.extend(main_program._distributed_lookup_table)`
			`else:`
			`exclude_var_names.append(main_program._distributed_lookup_table)`

			`local_vars = list(`
			`filter(__exclude_vars(exclude_var_names), main_program.list_vars())`
			`)`
			`paddle.static.save_vars(`
			`executor, main_program=main_program, dirname=dirname, vars=local_vars`
			`)`

			`if main_program._is_chief:`
			`if remote_params_map:`
			`__save_remote_params(executor, dirname, remote_params_map)`
			`if main_program._distributed_lookup_table:`
			`__save_distributed_lookup_tables(`
			`executor,`
			`dirname,`
			`main_program._distributed_lookup_table,`
			`main_program._endpoints,`
			`)`


			`def is_persistable(var):`
			`"""`
			`Check whether the given variable is persistable.`

			`Args:`
			`var(Variable): The variable to be checked.`

			`Returns:`
			bool: True if the given `var` is persistable
			`False if not.`

			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00

[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> import paddle`
			`>>> paddle.enable_static()`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> image = paddle.static.data(name='image', shape=[None, 28], dtype='float32')`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> bias_attr = paddle.ParamAttr('fc.b')`
			`>>> fc = paddle.static.nn.fc(image, size=10, bias_attr=bias_attr)`
			`>>> param = paddle.static.default_main_program().global_block().var('fc.b')`
			`>>> res = paddle.distributed.io.is_persistable(param)`

[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`"""`
			`if (`
			`var.desc.type() == core.VarDesc.VarType.FEED_MINIBATCH`
			`or var.desc.type() == core.VarDesc.VarType.FETCH_LIST`
			`or var.desc.type() == core.VarDesc.VarType.READER`
			`):`
			`return False`
			`return var.persistable`


			`@dygraph_not_support`
			`def save_persistables(executor, dirname, main_program=None, filename=None):`
			`"""`
			Save all persistable variables from :code:`main_program` to
			the folder :code:`dirname` or file :code:`filename`. You can refer to
			:ref:`api_guide_model_save_reader_en` for more details. And then
			saves these persistables variables to the folder :code:`dirname` or file
			:code:`filename`.

			The :code:`dirname` is used to specify the folder where persistable variables
			`are going to be saved. If you would like to save variables in separate`
			files, set :code:`filename` None; if you would like to save all variables in a
			single file, use :code:`filename` to specify the file name.

			`Args:`
			`executor(Executor): The executor to run for saving persistable variables.`
			You can refer to :ref:`api_guide_executor_en` for
			`more details.`

			`dirname(str, optional): The saving directory path.`
			`When you need to save the parameter to the memory, set it to None.`
Fix some typos (persistbale, Retruns, etc.)(#61744) 2024-02-19 16:10:53 +08:00			`main_program(Program, optional): The program whose persistable variables will`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`be saved. You can refer to`
			:ref:`api_guide_Program_en` for more details.
			`If it is None, the default main program will`
			`be used.`
			`Default: None.`
			`filename(str, optional): The file to save all variables. If you prefer to`
			`save variables in different files, set it to None.`
			`Default: None.`

			`Returns:`
			`str: When saving parameters to a file, returns None.`
			`When saving parameters to memory, returns a binary string containing parameters.`

			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> import paddle`

			`>>> paddle.enable_static()`
			`>>> dir_path = "./my_paddle_model"`
			`>>> file_name = "persistables"`
			`>>> image = paddle.static.data(name='img', shape=[None, 28, 28], dtype='float32')`
			`>>> label = paddle.static.data(name='label', shape=[None, 1], dtype='int64')`
			`>>> feeder = paddle.base.DataFeeder(feed_list=[image, label], place=paddle.CPUPlace())`

			`>>> predict = paddle.static.nn.fc(x=image, size=10, activation='softmax')`
			`>>> loss = paddle.nn.functional.cross_entropy(input=predict, label=label)`
			`>>> avg_loss = paddle.mean(loss)`
			`>>> exe = paddle.static.Executor(paddle.CPUPlace())`
			`>>> exe.run(paddle.static.default_startup_program())`
			`>>> paddle.distributed.io.save_persistables(executor=exe, dirname=dir_path, filename=file_name)`
			`>>> # The persistables variables weights and bias in the fc layer of the network`
			`>>> # are going to be saved in the same file named "persistables" in the path`
			`>>> # "./my_paddle_model"`
[remove fluid] under fleet meta_optimizers (#47864) * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers * [remove fluid] under fleet meta_optimizers 2022-11-16 15:48:33 +08:00			`"""`
			`if main_program and main_program._is_distributed:`
			`return _save_distributed_persistables(`
			`executor, dirname=dirname, main_program=main_program`
			`)`
			`else:`
			`return paddle.static.save_vars(`
			`executor,`
			`dirname=dirname,`
			`main_program=main_program,`
			`vars=None,`
			`predicate=is_persistable,`
			`filename=filename,`
			`)`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00

			`@static_only`
			`def load_inference_model_distributed(`
			`dirname,`
			`executor,`
			`model_filename=None,`
			`params_filename=None,`
			`pserver_endpoints=None,`
			`):`
			`"""`
			`Load the inference model from a given directory. By this API, you can get the model`
[Docathon] Fix NO19，20 API Label (#58827) * [Docathon] Fix NO19,20 API Label * modified: python/paddle/distributed/io.py modified: python/paddle/reader/decorator.py 2023-11-10 15:40:55 +08:00			`structure(Inference Program) and model parameters.`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00			You can refer to :ref:`api_guide_model_save_reader_en` for more details.

			`Args:`
			`dirname(str): One of the following:`
			`- The given directory path.`
			`- Set to None when reading the model from memory.`
			`executor(Executor): The executor to run for loading inference model.`
			See :ref:`api_guide_executor_en` for more details about it.
			`model_filename(str, optional): One of the following:`
			`- The name of file to load the inference program.`
			- If it is None, the default filename ``__model__`` will be used.
			- When ``dirname`` is ``None``, it must be set to a string containing model.
			Default: ``None``.
			`params_filename(str, optional): It is only used for the case that all`
			`parameters were saved in a single binary file. One of the following:`
			`- The name of file to load all parameters.`
			- When ``dirname`` is ``None``, it must be set to a string containing all the parameters.
			- If parameters were saved in separate files, set it as ``None``.
			Default: ``None``.

			`pserver_endpoints(list, optional): It is only needed by the distributed inference.`
			`If using a distributed look up table during the training,`
			`this table is also needed by the inference process. Its value is`
			`a list of pserver endpoints.`

			`Returns:`
			`list: The return of this API is a list with three elements:`
			(program, feed_target_names, fetch_targets). The `program` is a
			``Program`` (refer to :ref:`api_guide_Program_en`), which is used for inference.
			The `feed_target_names` is a list of ``str``, which contains names of variables
			that need to feed data in the inference program. The `fetch_targets` is a list of
			``Variable`` (refer to :ref:`api_guide_Program_en`). It contains variables from which
			`we can get inference results.`


			`Examples:`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`.. code-block:: pycon`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> import paddle`
			`>>> import paddle.base as base`
			`>>> import numpy as np`

			`>>> paddle.enable_static()`
			`>>> # Build the model`
			`>>> main_prog = paddle.static.Program()`
			`>>> startup_prog = paddle.static.Program()`
			`>>> with paddle.static.program_guard(main_prog, startup_prog):`
			`... data = paddle.static.data(name="img", shape=[64, 784], append_batch_size=False)`
			`... w = paddle.create_parameter(shape=[784, 200], dtype='float32')`
			`... b = paddle.create_parameter(shape=[200], dtype='float32')`
			`... hidden_w = paddle.matmul(x=data, y=w)`
			`... hidden_b = base.layers.elementwise_add(hidden_w, b)`
			`>>> place = base.CPUPlace()`
			`>>> exe = base.Executor(place)`
			`>>> exe.run(startup_prog)`

			`>>> # Save the inference model`
			`>>> path = "./infer_model"`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> base.io.save_inference_model(`
			`... dirname=path,`
			`... feeded_var_names=['img'],`
			`... target_vars=[hidden_b],`
			`... executor=exe,`
			`... main_program=main_prog,`
			`... )`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> # Demo one. Not need to set the distributed look up table, because the`
			`>>> # training doesn't use a distributed look up table.`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> [inference_program, feed_target_names, fetch_targets] = paddle.distributed.io.load_inference_model_distributed(`
			`... dirname=path, executor=exe`
			`... )`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> tensor_img = np.array(np.random.random((1, 64, 784)), dtype=np.float32)`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> results = exe.run(`
			`... inference_program,`
			`... feed={feed_target_names[0]: tensor_img},`
			`... fetch_list=fetch_targets,`
			`... )`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> # Demo two. If the training uses a distributed look up table, the pserver`
			`>>> # endpoints list should be supported when loading the inference model.`
			`>>> # The below is just an example.`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`>>> endpoints = ["127.0.0.1:2023", "127.0.0.1:2024"]`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> [dist_inference_program, dist_feed_target_names, dist_fetch_targets] = (`
[CodeStyle][DocFormat][126] Use `pycon` marker in distributed docs examples (#77990) 2026-02-20 11:37:23 +08:00			`... paddle.distributed.io.load_inference_model_distributed(`
			`... dirname=path,`
			`... executor=exe,`
			`... pserver_endpoints=endpoints,`
			`... )`
			`... )`
[xdoctest] reformat example code with google style in 211,281,308,323 (#57301) * fix sample codes * fix code-style * fix bug * fix bug 2023-09-22 10:18:14 +08:00			`>>> # In this example, the inference program was saved in the file`
			`>>> # "./infer_model/__model__" and parameters were saved in`
			`>>> # separate files under the directory "./infer_model".`
			`>>> # By the inference program, feed_target_names and`
			`>>> # fetch_targets, we can use an executor to run the inference`
			`>>> # program for getting the inference result.`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00			`"""`
			`load_from_memory = False`
			`if dirname is not None:`
			`load_dirname = os.path.normpath(dirname)`
			`if not os.path.isdir(load_dirname):`
[CodeStyle][UP031] fix `/python/paddle/distributed/{passes, transpiler, utils}*` - part 13 (#65573) 2024-06-30 06:27:22 +08:00			`raise ValueError(f"There is no directory named '{dirname}'")`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00
			`if model_filename is None:`
			`model_filename = '__model__'`

			`model_filename = os.path.join(`
			`load_dirname, os.path.basename(model_filename)`
			`)`

			`if params_filename is not None:`
			`params_filename = os.path.basename(params_filename)`

			`with open(model_filename, "rb") as f:`
			`program_desc_str = f.read()`
			`else:`
			`load_from_memory = True`
			`if params_filename is None:`
			`raise ValueError(`
			`"The path of params cannot be None when the directory path is None."`
			`)`
			`load_dirname = dirname`
			`program_desc_str = model_filename`
			`params_filename = params_filename`

			`program = Program.parse_from_string(program_desc_str)`
			`if not core._is_program_version_supported(program._version()):`
[CodeStyle][UP031] Use f-string instead of percent format in part of distributed files (part21) (#70033) 2024-12-08 12:46:32 +08:00			`raise ValueError(f"Unsupported program version: {program._version()}\n")`
[fluid clean]replace fliud.io.load_inference_model from util_factory.py (#49156) * add index sample fp16 support * remove fluid APIs in distributed_strategy.py and role_maker.py * Revert "remove fluid APIs in distributed_strategy.py and role_maker.py" This reverts commit 223bbee990d3bf69e252fc3c0f19e3873550a264. * move load_inference_model to distributed * fix origin develop codes diff * move _endpoints_replacement * delete line * reset line * add unittest case of load_inference_model * fix unittest * fix unittest * fix coverage * fix coverage 2022-12-26 14:52:26 +08:00			`# Binary data also need versioning.`
			`load_persistables(executor, load_dirname, program, params_filename)`

			`feed_target_names = program.desc.get_feed_target_names()`
			`fetch_target_names = program.desc.get_fetch_target_names()`
			`fetch_targets = [`
			`program.global_block().var(name) for name in fetch_target_names`
			`]`

			`return [program, feed_target_names, fetch_targets]`