数据预处理模块
============
数据预处理是数据分析过程中的重要环节。AutoSTAT 提供了 Preprocessing Agent 负责数据预处理,帮助您快速清洗和准备数据。
功能特点
---------
.. raw:: html
预处理操作建议
- 除了根据您的数据预处理需求执行操作外, Preprocessing Agent 还可在理解数据集特征的基础上,自动生成预处理建议,协助完成缺失值处理、异常值检测及数据标准化等任务。
.. raw:: html
代码执行预处理
- Preprocessing Agent 可根据系统建议或用户需求,以自动生成代码的方式灵活地执行数据预处理操作。若运行过程中出现错误, Agent 将自动分析并尝试修复。
.. raw:: html
预处理结果下载
- 数据预处理完成后,系统提供结果下载按钮,用户可直接获取预处理后的数据集。
操作教程
----------------
预处理展示
~~~~~~~~~~~~~~~
预处理展示模块显示各列的名称、数据类型、非空值数量及缺失值比例,用于辅助制定预处理方案。
.. image:: images/数据预处理-预处理展示.png
:alt: 数据预处理-预处理展示
预处理建议
~~~~~~~~~~~~~~~
用户可通过与 Preprocessing Agent 交互获取数据预处理建议。
当建议生成后,系统将在对话栏下方显示 “生成预处理代码” 按钮,点击该按钮即可自动生成可执行的 Python 预处理脚本。
.. image:: images/数据预处理-预处理建议.png
:alt: 数据预处理-预处理建议
.. image:: images/数据预处理-代码生成.png
:alt: 代码生成
预处理执行
~~~~~~~~~~~~~~~
在预处理执行模块中,用户可对生成的预处理代码进行编辑与执行,以灵活调整数据处理流程。
.. note::
大模型生成的代码可能存在错误,运行过程中如发生异常,Preprocessing Agent 将自动分析并尝试修复。
.. image:: images/数据预处理-预处理执行.png
:alt: 数据预处理-预处理执行
预处理结果
~~~~~~~~~~~~~~~
在预处理结果模块中,用户可以对比查看数据处理前后的变化,并可下载已处理完成的数据集。
数据预处理完成后,Preprocessing Agent 将自动与其他 Agent 进行通信,并在后续步骤中优先使用预处理后的数据集,无需用户额外操作。
.. image:: images/数据预处理-预处理结果.png
:alt: 数据预处理-预处理结果
完成数据预处理后,您可以根据需求,选择后续操作。