Cloudflare WorkerベースのAI画像生成スクリプト

1.6K 00

はじめに

CloudFlare-AI-ImageはGitHubでホスティングされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。以下の5つのモデルに基づいて、テキスト生成とグラフ生成をサポートしています。フラックス.1 [schnell]、Stable Diffusion XLなどのSD-XL-Base-CFがデフォルトで使用されています。ユーザーは、テキスト説明を入力したり、参照画像をアップロードしたりすることで、高品質の画像を生成できます。プロジェクトのインターフェイスはOpenAIフォーマットと互換性があるため、開発者、デザイナー、クリエイティブな愛好家にとって統合しやすく、導入も簡単です。Cloudflareのグローバルネットワークにより、生成速度は高速かつ安定しており、コードはオープンソースで自由に変更することができます。

機能一覧

テキストから画像を生成することをサポートし、高品質の画像を生成するためにテキスト説明を入力します。
アップロードされた参照画像に基づいて新しい画像を生成するグラフ生成画像に対応。
DS-8-CF、SD-XL-Bash-CF、SD-XL-Lightning-CF、FLUX.1-Schnell-CF、SF-Kolorsの5つのオプションモデルが用意されている。
サードパーティのアプリケーションに簡単に統合できるOpenAIフォーマットと互換性のあるREST API。
画像スタイル、ステップ数、解像度などの生成パラメータをカスタマイズ可能。
Cloudflare Workers上に展開するため、管理サーバーは不要です。
生成された画像をキャッシュするKVストレージをサポート。
オープンソースのコードで、ユーザーが変更・拡張可能。

ヘルプの使用

設置プロセス

CloudFlare-AI-Imageを使用するには、以下のデプロイ手順を完了する必要がある。手順は簡単ですが、環境の設定を慎重に行う必要があります。

Cloudflareアカウントにサインアップする
Cloudflareの公式サイトにアクセスし、アカウント登録またはサインインしてください。このプロジェクトをサポートするには無料プランで十分です。アカウントにWorkers AIとKVネームスペースのパーミッションがあることを確認してください。
プロジェクトコードの複製
ターミナルで以下のコマンドを実行し、プロジェクトをローカルにクローンする：
```
git clone https://github.com/justlovemaki/CloudFlare-AI-Image.git
```
プロジェクト・カタログにアクセスする：
```
cd CloudFlare-AI-Image
```
ラングラーの取り付け
WranglerはCloudflare Workersをデプロイするためのツールです。インストールコマンド
```
npm install -g @cloudflare/wrangler
```
Wranglerにログイン：
```
wrangler login
```
プロンプトに従ってブラウザで認証してください。
環境変数の設定
プロジェクトは、Workers AI および KV 名前空間をバインドし、アカウント情報を構成する必要がある。
- Cloudflareのダッシュボードにログインし、アカウントIDを見つけます。
- Workers AI、Workers スクリプト編集、KV ストレージを含む権限を持つ API トークンを作成する。
- コンパイラ wrangler.toml ファイルにアカウントIDとKV名前空間を追加する：
```
account_id = "你的账户ID"
name = "cloudflare-ai-image"
compatibility_date = "2023-09-01"
[[kv_namespaces]]
binding = "IMAGE_KV"
id = "你的KV命名空间ID"
```
- KVネームスペースを作成する：
```
wrangler kv:namespace create IMAGE_KV
```
  返されたIDをコピーして wrangler.toml.
- APIトークンを設定します：
```
wrangler secret put CLOUDFLARE_API_TOKEN
```
  APIトークンを入力してください。
- (オプション）シリコン・ベースのフロー・ステージ・モデルを使用する場合は、SF_TOKENを設定する：
```
wrangler secret put SF_TOKEN
```
  Silicon Mobility Platformから要求されたAPIトークンを入力します。
配備プロジェクト
プロジェクト・ディレクトリで実行する：
```
wrangler publish
```
デプロイに成功したら、Workers URLを取得する。 https://cloudflare-ai-image.your-account.workers.dev.
ローカルテスト
ローカル・デバッグが必要な場合は、実行する：
```
wrangler dev
```
これでローカル・サーバーが起動し http://localhost:8787 テスト機能。

使用方法

デプロイ後は、API、クライアント、またはWorkers URL経由で画像生成を使用できます。以下はその詳細な手順です。

モデルを選択

このプロジェクトは5つのモデルをサポートしており、FLUX.1-Schnell-CFが最良の結果を得るために推奨されているが、1日の使用量には制限がある。その他のモデルは以下の通り：

DS-8-CFDreamshaper-8-LCMをベースとしており、アート風の画像を素早く生成するのに適しています。
SD-XL-バッシュCFデフォルトモデルは、Stable Diffusion XLに基づき、スピードとクオリティのバランスをとっています。
SD-XL-ライトニング-CFスピードに最適化され、シンプルなシナリオに適しています。
FLUX.1-シュネルCFディテールに富んだハイクオリティモデル。
SFコロールズSF_TOKENは、クワイカラーをベースに、アジアンテイストの画像に適した設定が必要です。

モデルを選択する場合、APIリクエストまたは設定ファイルでモデル名を指定します。 "model": "@cf/black-forest-labs/flux-1-schnell".

ヴァンセンヌ図

ベン図はテキストの説明からイメージを生成する。

API経由::
POSTリクエストを使ってAPIエンドポイントを呼び出す：

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "一片星空下的雪山，月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'

画像のURLまたはBase64データを含むJSONを返します。

クライアント経由::
プロジェクト・インターフェースはOpenAIフォーマットと互換性があり、以下のようなOpenAI対応クライアントで使用できる。チャットGPT (クライアント）。クライアントのAPIアドレスをあなたのWorkers URLに設定し、画像を生成するプロンプトを入力します。
ワーカーズURL経由::
インタビュー https://your-project.workers.devプロンプトの単語を入力し、Generateをクリックすると、ブラウザに画像が表示される。

プロンプトワードの最適化::
明確なキューワードが画質を高める。例

ファジーだ："一朵花"
最適化："一朵盛开的红玫瑰，背景是绿色草地，阳光明媚"
次のような英語のキューの方が効果的かもしれない。 "A red rose in bloom on a green meadow under bright sunlight".

ツーソン

タプルは参照画像に基づいて新しい画像を生成する。

API経由::
画像をアップロードし、手がかりとなる言葉を入力してください：

curl -X POST https://your-project.workers.dev/api/generate \
-H "Content-Type: application/json" \
-d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}'

ワーカーズURL経由::
ページにアクセスし、参照画像をアップロードし、説明を入力する（例：以下のように）。 "卡通风格") を使って新しい画像を生成する。

カスタムパラメータ

以下のパラメーターの調整が可能：

ステップデフォルトは8、範囲は1～50、ステップが高いほど詳細が得られるが、消費時間が長くなる。
解像デフォルト512x512、機種により1024x1024まで調整可能。
ヘアスタイルなどの合図でコントロールする。 "油画风格"そして"赛博朋克".
APIリクエストにパラメータを追加する：

{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}

強制翻訳オプション

--ntl翻訳を無効にし、多言語ユーザーのために元のプロンプトの単語を保持します。
--TL生成の質を高めるため、促音語を強制的に英語に翻訳する。
APIリクエストに "translate": "tl" もしかしたら "translate": "ntl".

ログを見る

Cloudflareのダッシュボードにログインし、Workersの概要にアクセスすると、リクエストログ、生成ログ、リソース使用量が表示されます。KVネームスペースは画像をキャッシュして重複生成を減らします。

ほら

フリークォータCloudflare Workersの無料プランの1日あたりのリクエスト数は100,000で、個人的な利用には十分です。Workers AIのモデルコールにはさらに制限がある場合があります（例：FLUX.1の1日あたりの制限）。
モデル・パフォーマンスSD-XL-Bash-CFは日常的な使用に適しています。
安全性不正アクセスを防ぐため、APIキーを設定することをお勧めします。
キュー・ワードの制限敏感な内容や不適切な内容を避けるため、モデルは自動的にフィルタリングされます。

アプリケーションシナリオ

コンテンツ制作
ブロガーは、自分の記事にイラストを描く必要がある。 "一片热带雨林，阳光穿透树叶"最新バージョンは、高品質の画像を数秒で生成し、デザイン費用を節約するデザインです。
アプリケーション開発
開発者は、APIを通じて動的に呼び出されるeコマース・プラットフォーム用の商品表示マップを生成し、以下のような説明を入力する。 "现代风格的沙发，白色背景"ユーザーエクスペリエンスを高めるために。
アート・ディスカバリー
生徒またはアーティストは、スケッチをアップロードし、ダイアグラム生成機能を使用し、次のように入力します。 "赛博朋克风格"研究やプレゼンテーションのためのユニークな作品を生み出す。
教育とトレーニング
教師はインプットなどの教材を作成する "古代中国的城市街道"歴史の授業で情景を視覚化するために使われる。

品質保証

画像生成にかかる時間は？
flux.1-schnell-cfが最も速く、sd-xl-bash-cfは少し遅い。
どのような画像タイプに対応していますか？
風景、人物、オブジェクト、アートスタイルなどをサポート。複雑なシーンはキューワードに最適化する必要があり、繊細なコンテンツはフィルタリングされます。
配備に費用はかかりますか？
必須ではありません。SF-Kolorsモデルには無料のSF_TOKENアプリケーションが必要です。
モデルを変更するには？
API リクエストでモデル名を指定するか、設定ファイルでデフォルトのモデルを変更します。FLUX.1-Schnell-CFをテストすることを推奨します。
テューペロの機能はどのようなものですか？
参照画像をアップロードし、説明を入力する（例． "卡通风格")、APIまたはページを通して新しい画像を生成する。