このドキュメントはAIによって翻訳されました。不正確な情報については、英語版をご参照ください
インポート Pro プラグインは、通常のインポート機能に加えて、さらに強化された機能を提供します。
このプラグインは非同期タスク管理プラグインに依存しています。使用する前に、非同期タスク管理プラグインを有効にする必要があります。


インポートを実行すると、その処理はユーザーによる手動設定なしに、独立したバックグラウンドスレッドで実行されます。ユーザーインターフェースでは、インポート操作を開始した後、右上に現在実行中のインポートタスクが表示され、リアルタイムでタスクの進捗が確認できます。

インポートが完了した後、インポートタスクから結果を確認できます。
大規模なデータインポートのパフォーマンスを評価するため、さまざまなシナリオ、フィールドタイプ、トリガー設定で比較テストを実施しました(サーバーやデータベースの構成によって結果は異なる場合がありますので、あくまで参考としてください)。
| データ量 | フィールドタイプ | インポート設定 | 処理時間 |
|---|---|---|---|
| 100万件 | 文字列、数値、日付、メールアドレス、長文テキスト | • ワークフローをトリガー:なし • 重複識別子:なし | 約1分 |
| 50万件 | 文字列、数値、日付、メールアドレス、長文テキスト、多対多 | • ワークフローをトリガー:なし • 重複識別子:なし | 約16分 |
| 50万件 | 文字列、数値、日付、メールアドレス、長文テキスト、多対多、多対一 | • ワークフローをトリガー:なし • 重複識別子:なし | 約22分 |
| 50万件 | 文字列、数値、日付、メールアドレス、長文テキスト、多対多、多対一 | • ワークフローをトリガー:非同期トリガー通知 • 重複識別子:なし | 約22分 |
| 50万件 | 文字列、数値、日付、メールアドレス、長文テキスト、多対多、多対一 | • ワークフローをトリガー:非同期トリガー通知 • 重複識別子:重複を更新、5万件の重複データあり | 約3時間 |
上記のパフォーマンス測定結果と既存の設計に基づき、影響要因について以下の説明と提案があります。
重複レコードの処理メカニズム:重複レコードを更新または重複レコードのみを更新オプションを選択すると、システムはレコードを1件ずつ検索および更新するため、インポート効率が著しく低下します。Excelファイルに不要な重複データが含まれている場合、インポート速度にさらに大きな影響を与えるため、インポート前にExcelファイル内の不要な重複データをクリーンアップ(例:専門の重複排除ツールを使用)してからシステムにインポートすることをお勧めします。これにより、無駄な時間を省くことができます。
リレーションフィールドの処理効率:システムがリレーションフィールドを処理する際、関連付けを1件ずつ検索する実装方式を採用しているため、大量データシナリオではパフォーマンスのボトルネックとなる可能性があります。シンプルなリレーション構造(例:2つのコレクション間の一対多関連)の場合、段階的なインポート戦略をお勧めします。まずメインコレクションの基本データをインポートし、完了後にコレクション間のリレーションを確立します。ビジネス要件によりリレーションデータを同時にインポートする必要がある場合は、上記の表のパフォーマンス測定結果を参考に、インポート時間を適切に計画してください。
ワークフローのトリガーメカニズム:大規模なデータインポートシナリオでワークフローのトリガーを有効にすることは推奨されません。主な理由は以下の2点です。
上記3つの影響要因については、今後さらなる最適化を検討していきます。

インポート時にワークフローをトリガーするかどうかを選択できます。このオプションをチェックし、そのコレクションがワークフロー(コレクションイベント)にバインドされている場合、インポートは各行に対してワークフローの実行をトリガーします。

このオプションをチェックし、対応するモードを選択すると、インポート時に重複レコードが識別され、処理されます。
インポート設定のオプションはデフォルト値として適用されます。管理者は、アップロード者がこれらのオプション(ワークフローをトリガーするオプションを除く)を変更することを許可するかどうかを制御できます。
アップロード者の権限設定



システムは、このフィールドの値に基づいて、行が重複レコードであるかどうかを識別します。