视觉数据

用于在视觉应用中获取 DataLoaders 数据以及更高级类 ImageDataLoaders 的辅助函数

此模块中定义的主要类是 ImageDataLoaders 和 SegmentationDataLoaders，因此您可能希望直接跳转到它们的定义。它们提供了工厂方法，是快速准备训练数据的绝佳方式，请参阅视觉教程了解示例。

辅助函数

get_grid

 get_grid (n:int, nrows:int=None, ncols:int=None, figsize:tuple=None,
           double:bool=False, title:str=None, return_fig:bool=False,
           flatten:bool=True, imsize:int=3, suptitle:str=None,
           sharex:"bool|Literal['none','all','row','col']"=False,
           sharey:"bool|Literal['none','all','row','col']"=False,
           squeeze:bool=True, width_ratios:Sequence[float]|None=None,
           height_ratios:Sequence[float]|None=None,
           subplot_kw:dict[str,Any]|None=None,
           gridspec_kw:dict[str,Any]|None=None)

返回一个包含 n 个轴的网格，按 rows 行 cols 列排列

	类型	默认值	详情
n	int		返回网格中的轴数量
nrows	int	None	返回网格中的行数，默认为 `int(math.sqrt(n))`
ncols	int	None	返回网格中的列数，默认为 `ceil(n/rows)`
figsize	tuple	None	返回图形的宽度、高度（以英寸为单位）
double	bool	False	是否将列数和 `n` 加倍
title	str	None	如果传入，则设置为图形的标题
return_fig	bool	False	是否返回由 `subplots` 创建的图形
flatten	bool	True	是否展平 matplot 轴，以便可以使用单个循环进行迭代
imsize	int	3	将在返回图形中显示的图像大小（以英寸为单位）
suptitle	str	None	设置为返回图形的标题
sharex	bool \| Literal[‘none’, ‘all’, ‘row’, ‘col’]	False
sharey	bool \| Literal[‘none’, ‘all’, ‘row’, ‘col’]	False
squeeze	bool	True
width_ratios	Sequence[float] \| None	None
height_ratios	Sequence[float] \| None	None
subplot_kw	dict[str, Any] \| None	None
gridspec_kw	dict[str, Any] \| None	None
返回值	(plt.Figure, plt.Axes)		默认仅返回 `axs`，如果 `return_fig` 设置为 True 则返回 (`fig`, `axs`)

这被视觉应用的类型分派版本的 show_batch 和 show_results 使用。默认的 figsize 是 (cols*imsize, rows*imsize+0.6)。imsize 会向下传递给 subplots。suptitle, sharex, sharey, squeeze, subplot_kw 和 gridspec_kw 都会向下传递给 plt.subplots。如果 return_fig 为 True，则返回 fig,axs，否则只返回 axs。

	类型	详情
bbox	TensorBBox	边界框坐标
label	TensorMultiCategory	边界框标签

	类型	默认值	详情
samples	list		像 (图像, 边界框, 标签) 这样的三元组列表
pad_idx	int	0	将用于填充每个标签列表的标签

	类型	默认值	详情
vocab	list	None	边界框的词汇标签
add_na	bool	True	将 NaN 添加为背景类

	类型	默认值	详情
loaders	VAR_POSITIONAL		要封装的 `DataLoader` 对象
path	str \| pathlib.Path	.	存储导出对象的路径
device	NoneType	None	放置 `DataLoaders` 的设备

辅助函数

get_grid

clip_remove_empty

bb_pad

用于视觉应用的 TransformBlock

ImageBlock

MaskBlock

PointBlock

BBoxBlock

BBoxLblBlock

ImageDataLoaders

ImageDataLoaders.from_folder

ImageDataLoaders.from_path_func

ImageDataLoaders.from_path_re

ImageDataLoaders.from_name_func

ImageDataLoaders.from_name_re

ImageDataLoaders.from_df

ImageDataLoaders.from_csv

ImageDataLoaders.from_lists

SegmentationDataLoaders

SegmentationDataLoaders.from_label_func

用于视觉应用的 `TransformBlock`