导入 Pro 插件在普通导入功能的基础上提供了增强功能。
此插件依赖异步任务管理插件,使用前需先开启异步任务管理插件。


在执行导入之后,导入的流程将在独立的后台线程中执行,无需用户手动配置。在用户界面中,执行导入操作后,右上方会显示当前正在执行的导入任务,并且实时展示任务进度。

导入结束后,可在导入任务中查看导入结果。
为了评估大规模数据导入的性能表现,我们在不同场景、字段类型及触发配置下进行对比测试(具体在不同服务器、数据库配置下可能会有差异,仅供参考):
| 数据量 | 字段类型 | 导入配置 | 处理时长 |
|---|---|---|---|
| 100万条 | 字符串、数字、日期、邮箱、长文本 | • 触发工作流:否 • 重复标识:无 | 约1分钟 |
| 50万条 | 字符串、数字、日期、邮箱、长文本、多对多 | • 触发工作流:否 • 重复标识:无 | 约16分钟 |
| 50万条 | 字符串、数字、日期、邮箱、长文本、多对多,多对一 | • 触发工作流:否 • 重复标识:无 | 约22分钟 |
| 50万条 | 字符串、数字、日期、邮箱、长文本、多对多,多对一 | • 触发工作流:异步触发通知 • 重复标识:无 | 约22分钟 |
| 50万条 | 字符串、数字、日期、邮箱、长文本、多对多,多对一 | • 触发工作流:异步触发通知 • 重复标识:更新重复,且有5万重复数据 | 约3个小时 |
根据上述性能测试结果以及现有的一些设计,对影响因素有以下说明和建议:
重复记录处理机制:当选择更新重复记录或仅更新重复记录选项时,系统会逐条执行查询和更新操作,这会显著降低导入效率。如果你的 Excel 中存在无用的重复数据,将会进一步显著影响导入速度,建议在导入前对 Excel 中无用的重复数据进行清理(如使用专业工具进行去重),然后再导入系统,这样能避免浪费不必要的时间。
关系字段处理效率:系统处理关系字段时采用逐条查询关联的实现方式,这在大数据量场景下会成为性能瓶颈。对于简单关系结构(如两表一对多关联),建议采用分步导入策略:先导入主表基础数据,待完成后再建立表间关系。如业务需求必须同时导入关系数据,请参考上表中的性能测试结果合理规划导入时间。
工作流处理机制:不建议在大规模数据导入场景下启用工作流触发,主要基于以下两方面考虑:
以上 3 条影响因素,会考虑后续进一步优化。

在导入时可选择是否触发工作流。如勾选此选项且该数据表绑定了工作流(数据表事件),导入将逐行触发工作流执行。

勾选此选项,选择对应模式,则导入时会识别重复记录,并进行处理。
导入配置中的选项将作为默认值应用,管理员可以控制是否允许上传者修改这些选项(除了触发工作流选项外)。
上传者权限设置



系统根据此字段值识别行是否为重复记录。