Wan 2.7 の使い方：初心者向け AI 動画チュートリアル

APIMart で Wan 2.7 を使って AI 動画を生成する方法を解説。APIキーの設定から、テキスト→動画・画像→動画・編集モードまでステップごとに学べます。

チュートリアル

急な学習コストなしに AI 生成動画を作りたいですか？ Wan 2.7（Alibaba の最新 AI 動画ジェネレーター）を使えば、わずか数分で高品質な短尺動画クリップを作成できます。APIMart 経由で利用でき、テキスト→動画・画像→動画・動画編集・参照→動画の各モードに対応しているため、さまざまなプロジェクトに柔軟に活用できます。

このチュートリアルで学べる内容を簡単にまとめます：

APIMart のセットアップ：アカウントを作成し、APIキーを取得して、従量課金制（720p は最安 $0.0664/秒）で開始する。
コア機能：テキストから動画を生成したり、静止画をアニメーション化したり、既存の映像を編集したりする。
ステップバイステップガイド：効果的なプロンプトの作成、適切なモードの選択、結果の微調整。

高性能なハードウェアは不要で、シンプルなクラウドベースのワークフローですぐに実験を始められます。さっそく始めましょう！

APIMart で Wan 2.7 をセットアップする

Wan 2.7 setup on the GccAi dashboard for AI video generation

APIMart アカウントを作成する

apimart.ai にアクセスし、無料アカウントまたは組織を作成してください。ログイン後、API キー管理に移動して固有の API キーを発行します。キーはその場でコピーして安全な場所に保管してください。表示されるのは一度だけです。このキーは、すべての API リクエストの Authorization ヘッダーに Bearer トークンとして使用します。

利用を開始する前に、必ずアカウントに残高を追加してください。APIMart は従量課金制なので、使った分だけ支払えばよく、サブスクリプションは不要です。

アカウントの設定と残高の確認が完了したら、次はシステム要件を確認しましょう。

システム要件

動画処理はすべてクラウド上で行われるため、高性能なコンピューターは必要ありません。必要なものは以下のとおりです：

要件	詳細
ブラウザ	Chrome、Firefox、Edge などのモダンブラウザ
インターネット	API 呼び出しと動画ダウンロード用の安定した接続
ストレージ	.mp4 ファイルを保存できる容量（ダウンロードリンクは24時間で失効）
ツール	cURL、Postman、Python、Node.js など任意の HTTP クライアント

ファイルへのアクセスを失わないよう、動画は24時間以内にダウンロードしてください。

次は、APIMart 上で Wan 2.7 を見つける方法を説明します。

APIMart で Wan 2.7 を探す

Wan 2.7 を見つけるのは簡単です。apimart.ai/model/wan-2-7 に直接アクセスするか、ダッシュボードの API リファレンスセクションから探してください。プラットフォームには wan2.7・wan2.7-r2v・wan2.7-videoedit の3つのモデルバージョンがあります。それぞれ異なる用途に対応していますが、料金はすべて同じで、720p が $0.0664/秒、1080p が $0.1096/秒です ^[2]。

コーディングを始める前に、内蔵のプレイグラウンドを活用しましょう。プロンプトを試してパラメーターを微調整できる便利なツールです。プロジェクトに組み込む前にモデルのパフォーマンスを素早く確認できます。動画は通常30〜90秒で完成し、99.9% の稼働率 SLA が保証されています ^[2]。API キーを保存してアカウントに残高があれば、動画生成を開始する準備が整いました。

Wan 2.7 のコア機能

Wan 2.7 Video Modes Compared: Inputs, Use Cases & Pricing

アカウントの設定が完了したところで、Wan 2.7 のコア機能を詳しく見ていきましょう。動画制作プロセスを強化するために設計された Wan 2.7 には、テキスト→動画・画像→動画（サブモードあり）・動画編集の3つのメインモードがあります。それぞれがプロジェクトの独自な出発点を提供します。

テキスト→動画：言葉をビジュアルに変換する

テキスト→動画（T2V）は、動画コンテンツを作成する最もシンプルな方法です。詳細な説明文を入力するだけで、Wan 2.7 が最大15秒、1080p HD・30fpsの動画クリップを生成します。被写体・動き・照明・カメラ指示を含む複雑なプロンプトにも対応しています。

最良の結果を得るには、プロンプトを次のように構成してください：[被写体] + [動作/モーション] + [環境] + [照明] + [カメラ] + [スタイル/雰囲気]。例：「居心地の良いカフェでバリスタがラテアートを注ぐ。温かいアンバー照明、スローなプッシュイン、シネマティックスタイル。」

効果的なプロンプト作成のヒントをいくつか紹介します：

「ゆっくり左パン」や「オービット」など、カメラの動きを具体的に指定する。
漠然とした形容詞ではなく、「注ぐ」や「歩く」などの能動的な動詞を使う。
ネガティブプロンプト（例：「ぼやけた、歪んだ、静止した」）を追加して不要なアーティファクトを最小限に抑える。
短いプロンプトの場合は prompt_extend オプションを有効にすると、品質向上のために説明が自動的に補強されます ^[3]。

「プロンプトは脚本だ。Wan 2.7 に最適なプロンプトを求めるということは、平易な言葉でビート、レンズ、サウンドをデザインすることに他ならない。」 - Ryan Barnett、テックライター ^[9]

コストを抑えるために、ドラフト段階では720p（$0.0664/秒）で始め、最終版は1080p（$0.1096/秒）で仕上げましょう ^[2]。次に、画像→動画モードがどのようにビジュアルを使ってシームレスなアニメーションを作るかを見ていきます。

画像→動画とファーストラスト・フレームアニメーション

画像→動画（I2V）モードは、外観と構図を保ちながら静止画に命を吹き込みます。image_urls パラメーターに1〜2枚の画像URLを指定するだけで、APIMart が自動的に I2V モードでリクエストを処理します ^[3]。

このモードには2つのサブオプションがあります：

ファーストフレーム→動画：1枚の画像から始め、モデルがそのフレームから前方への動きを生成します。商品写真・ポートレート・イラストのアニメーション化に最適です。
ファーストラスト・フレーム：最初と最後の2枚の画像を提供すると、モデルがその間のスムーズなトランジションを生成します。アニメーションを精密にコントロールできます。

I2V を使う場合、画像がすでにビジュアルを定義しているため、プロンプトはモーションとカメラの動作に集中させましょう。例：「スローズームアウト」、「目をそっとまたたく」、「カメラが右にゆっくり流れる」。

イラストレーターの Ming Li はこの機能についての体験を共有しています：

「画像→動画機能のおかげで、ポスト制作の時間が大幅に節約できました。キーフレームを提供するだけで、あとは WAN 2.7 がやってくれます。」 ^[2]

もう一つの利点：アスペクト比は入力画像の寸法に基づいて自動設定されるため、手動調整は不要です ^[3]。ゼロから始めるのではなく既存の映像を調整したい場合は、動画編集モードが最適です。

動画編集とリスタイリング

wan2.7-videoedit モデルを使えば、平易な言語の指示で既存の動画クリップを修正できます。新しいシーンを作る代わりに、_「背景をサンセットビーチに変える」や「カメラパンをスローダウンする」_など変更したい内容を記述するだけで、残りの映像を保ちながらモデルが適用します ^[1]。

最良の結果を得るには、**replace（置き換える）、remove（削除する）、brighten（明るくする）、slow（遅くする）、restyle（スタイルを変える）**などの直接的な動作動詞を使いましょう。意図しない編集を避けるために、何を変更しないかも明確にしてください。例：「背景を森に置き換える。被写体と照明は変更しない。」 このレベルの明確さがエラーを最小化します ^[7]。

また、video_urls パラメーターは動画の続きをサポートしており、既存のクリップを自然に延長できます。再撮影や新しいプロンプトなしでシーケンスを長くしたい場合に最適です ^[3]。

「WAN 2.7 はクリップを操舵することだ…Wan 2.6 はクリップを手に入れることだった。」 - MkSaaS、チュートリアル著者 ^[1]

各モードをいつ使うべきか、必要な入力を簡単にまとめます：

モード	入力	最適な用途
テキスト→動画	テキスト `prompt` のみ	ゼロから新しいシーンを生成する
画像→動画（ファーストフレーム）	`image_urls` に画像1枚	写真やイラストをアニメーション化する
ファーストラスト・フレーム	`image_urls` に画像2枚	ショットの開始と終了をコントロールする
動画の続き	`video_urls` に既存クリップ	動画シーケンスを延長する
動画編集	元動画 + 編集指示	既存映像をリスタイルまたは修正する

ステップバイステップ：Wan 2.7 で初めての動画を作る

適切なモードを選ぶ

Wan 2.7 にはさまざまな動画制作タイプに合わせた複数のモードがあります。プロジェクトに合ったモードの選び方を紹介します：

T2V（テキスト→動画）：アイデアをビジュアルクリップに変換するのに最適。
I2V（画像→動画）：写真をダイナミックなシーケンスにアニメーション化する。
動画編集：既存の映像を修正・強化する。高忠実度の代替結果が必要な場合は MiniMax-Hailuo-02 も検討してください。
R2V（参照→動画）：画像・動画クリップ・音声などのマルチメディア入力を使用して、動画全体の一貫性を確保する。

迷った場合、APIMart は入力内容に基づいて自動的に適切なモードを選択します。高度なプロジェクトでは、wan2.7-r2v モデルIDで最大5つの混合参照を使用でき、最終出力をより細かく制御できます。

入力と設定を準備する

始める前に、入力と設定を整えておきましょう。簡単なガイドを紹介します：

プロンプトを作成する：[被写体] + [動作] + [環境] + [カメラの動き] + [速度] + [スタイル] の形式で構成します。
例：「モダンなキッチンでシェフが料理を盛り付ける。温かい頭上照明、スローなプッシュイン、シネマティック。」
- プロンプトが30語未満の場合は prompt_extend を有効にすると、シネマティックな詳細が自動的に追加されます。
アセット要件：
- 画像・動画には公開 HTTPS URL を使用する。
- 編集や続きを作成する場合、ファイルは MP4 または MOV 形式で、2〜10秒、100MB 以内である必要がある。

コアパラメーターを設定する：
最適な結果のためにこれらの主要設定を調整してください：

パラメーター	推奨値	備考
`resolution`	`720P`	最終レンダリング時のみ `1080P` を使用。
`duration`	`5`	2〜15秒の範囲（T2V/I2V）。
`size`	`16:9`	T2V に適用。I2V はサイズを自動検出。
`negative_prompt`	"blurry, distorted, low quality"	よくある視覚的問題の軽減に役立つ。
`seed`	0以上の整数	一貫した結果のために保存しておく。

720P の解像度から始めると、APIMart で 1080P（$0.1096/秒）と比較して約39%のコスト削減（$0.0664/秒）ができます。

初めての API 呼び出しを行う

APIMart での動画生成は非同期で動作します。フローは以下のとおりです：

リクエストを送信する：以下のような最小限の T2V の JSON リクエストを送信します：

{
  "model": "wan2.7",
  "prompt": "A chef plates a dish in a modern kitchen, warm overhead lighting, slow push-in, cinematic.",
  "resolution": "720P",
  "duration": 5,
  "size": "16:9",
  "negative_prompt": "blurry, distorted, low quality",
  "prompt_extend": true
}

task_id を取得する：進捗を追跡するための task_id が返されます。
ステータスをポーリングする：15秒ごとにステータスエンドポイントを確認します。ステータスが SUCCEEDED に更新されたら、すぐに動画をダウンロードしてください。URL は24時間で失効します。

ダウンロード後、必要に応じて動画を確認・調整できます。

結果を確認・調整する

動画が完成したら、細かく調整する時間です。クリップを注意深く視聴して、モーションドリフト（クリップの途中で被写体が変化する現象）や静的な動きなどの問題を確認しましょう。結果を改善するためのヒントを紹介します：

変数を微調整する：カメラキュー、動詞、デュレーションなど、一度に1つの要素を調整します。この方法により、プロンプト全体を見直さなくても何が効果的かを特定できます。
シードを固定する：成功した結果の seed 値を保存します。これにより、後で同じ出力を再現できるようになります。

「良い出力が見つかったら[シードを]固定してください。それが、複数の実行にわたって結果を再現可能にする唯一のパラメーターです。」 - Dora、WaveSpeed Blog

静的すぎるクリップには、「ドーリーイン」「スロープッシュ」「ハンドヘルド」などのシネマティックな表現を追加してみましょう。動画の特定部分を修正する必要がある場合は、wan2.7-videoedit に切り替えて明確な指示を提供してください。例：「背景を森に置き換える。被写体と照明は変更しない。」 これにより、最初からやり直すことなく特定の要素を改善できます。

トラブルシューティングとヒント

動画プロジェクトに取り組む際には、いくつかの障壁に直面することがあります。以下に、よくある問題の解決策と結果を改善するための実践的なアドバイスをまとめています。

よくある問題とその解決方法

Wan 2.7 の問題の多くはセットアップのミスに起因します。よくある問題とその解決方法を簡単にまとめます：

問題	原因として考えられること	解決方法
リクエストが完全に失敗する	リージョンの不一致	API キーとエンドポイント URL が同じリージョンであることを確認する ^[5]
動画が静止画のように見える	プロンプト内のモーションが不足	「頭を向ける」などの動作動詞や「ドーリーフォワード」などのカメラ指示を追加する ^[8]
クリップの途中で被写体が変わる	プロンプトが過負荷	被写体1つ・動作1つ・場所1つに絞ってシンプルにする ^[8]
送信時に 400 エラーが発生する	パラメーターの競合	`audio_url` と `image_urls` または `video_urls` を同時に送信しない ^[3]
動画 URL にアクセスできない	リンクの期限切れ	生成後24時間以内に動画をダウンロードする ^[5]^[2]

ファイル要件： 続きを作成するための入力動画は MP4 または MOV 形式で、2〜10秒、100MB 以内である必要があります。音声ファイルは WAV または MP3 形式で、15MB 以内が必要です ^[3]。これらの基準を満たさないファイルは、エラーなく失敗するか 400 エラーが発生する可能性があります。

よくある問題に対処したら、より良い結果のために動画を細かく調整することに集中しましょう。

より良い動画品質のためのヒント

プロンプトの品質が直接動画に影響します。うまく構造化されたプロンプトはより良い結果をもたらします。[被写体] + [動作] + [環境] + [照明] + [カメラ] + [スタイル/雰囲気] の公式を使ってください ^[6]。これにより、モデルが目的のある出力を作成するのに十分なコンテキストが確保されます。

画像→動画モードでは、プロンプトは何が_動く_べきか、カメラがどのように動くべきかに集中させましょう。wan2.7 image 自体を再描写しないでください。商品の形や色など特定の要素を一貫させる必要がある場合は、歪みを防ぐためにプロンプトでそれを明確にしてください。

720P 解像度でドラフトを作成することから始めましょう。動きに満足したら、最終レンダリングで 1080P にアップグレードします ^[2]。

ファーストラスト・フレームモードでは、テキストプロンプトよりも入力画像の品質が重要です。最良の結果を得るには、明確な空間的関係を持つ2枚の画像ペアを使用してください。よく一致したペアは、どんなに洗練されたテキストプロンプトよりも一貫した出力を生成します ^[4]。

Wan 2.7 を責任を持って使う

APIMart で利用できる Wan 2.7 は商用利用のライセンスが付与されており、プロフェッショナルなプロジェクトに最適なツールです ^[2]。ただし、倫理ガイドラインに従うことが重要です。明示的な許可なしに実在の人物の識別可能な画像や音声を使用しないでください。参照画像や動画を使用する場合は、使用権を確保してください。

APIMart には watermark ブールパラメーターも含まれており、動画に「AI Generated」ラベルを追加できます ^[3]。公開コンテンツに対してこれを有効にすることは、AI の関与について透明性を保つ簡単な方法です。異なるシネマティックスタイルが必要なプロジェクトでは、Google の Veo 3.1 API も検討してみてください。

まとめ

これで Wan 2.7 を使って初めての AI 生成動画を作るための基本が身についています。手順はシンプルです：APIMart アカウントをセットアップし、残高を追加し、API キーを取得し、720P 解像度で基本的なテキスト→動画リクエストの実験を始める。このアプローチにより、プロセスに慣れながらコストを管理できます。

一歩ずつ進めましょう：5秒の短いクリップから始め、成功した出力のシード値を記録し、徐々により長く、より高品質な動画に移行していきます。時間をかけることで、どのモードが自分のニーズに最も合っているかがわかってきます。オリジナルシーンの生成ならテキスト→動画、特定のビジュアルを活かすなら画像→動画、クリップの始まりと終わりを精密にコントロールするならファーストラスト・フレームです。

APIMart での720P が $0.0664/秒、1080P が $0.1096/秒（公式価格より20%割引）^[2]で、720P での5秒テストクリップは $0.34 未満です。クリエイティブな旅を手頃な価格で始める方法として最適です。

よくある質問

複数のクリップにわたってキャラクターを一貫させるにはどうすればいいですか？

Wan 2.7 でキャラクターデザインの一貫性を保つには、**参照→動画（R2V）**機能を活用してください。効果的な方法を紹介します：

最大5枚の高品質な参照画像または動画クリップを提供してください。正面・横・斜めなど、異なる角度からキャラクターを撮影したものを用意してください。この多様性により、システムがキャラクターの外見をより包括的に理解できます。
テキストプロンプトを書く際は、割り当てられたインデックス（例：「画像1」や「クリップ2」）でアセットを参照してください。明確な参照により、正確な結果が得られます。
より複雑なセットアップでは、9グリッドの参照パネルの作成を検討してください。このグリッドで複数の角度や表情を表示することで、システムがキャラクターをより広く理解できます。すべてのプロンプトで一貫した詳細な説明を組み合わせることで、最良の結果が得られます。

ビジュアル参照と丁寧に作成されたプロンプトを組み合わせることで、均一で洗練されたキャラクター表現が実現します。

動画に変な動きやフリッカーが出た場合はどうすればいいですか？

動画のモーションやフリッカーの問題に対処するには、ブラーやジッターなどの不要なアーティファクトを最小化するために_ネガティブプロンプト_を使用してください。この手法により、よりスムーズな出力に調整できます。

画像→動画のトランジションでは、クリーンなソース画像から始めましょう。ごちゃごちゃした背景や複雑な背景の画像を使うと不安定さが増す可能性があります。クリップの途中でフリッカーが発生する場合、多くは照明の不一致や焦点距離の変化が原因です。これらの要素を安定させることが乱れを減らす鍵です。

また、プロンプトをシンプルにするかカメラの動きを制限することで、動画全体を通じてスムーズで安定したモーションを維持するのに大いに役立ちます。

クリップを生成する前にコストを見積もるにはどうすればいいですか？

APIMart での動画コストを計算するには、クリップのデュレーションに選択した解像度の秒あたりの料金を掛けるだけです。Wan 2.7 は出力設定に基づいたシンプルな料金モデルを採用しています。事前に料金の詳細を確認することで、より効果的に予算を計画できます。ただし、これらの計算はあくまでも見積もりです。最終的なコストはモデルが生成した実際の出力によって決定されます。

次は試してみましょう