page-agent
page-agent は、自然言語の指示でページ内の UI 操作を実行する JavaScript の GUI エージェントである。ページへ組み込んで利用するほか、MCP サーバーも提供されており、外部のエージェントや自動化からブラウザ操作を統合しやすい。
npm での導入例は次のとおりである。
bash
npm install page-agentjs
import { PageAgent } from "page-agent";
const agent = new PageAgent({
model: "qwen3.5-plus",
baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
apiKey: "YOUR_API_KEY",
language: "en-US",
});
await agent.execute("Click the login button");MCP の利用では、外部からの接続を許可する範囲や待受設定を含めた運用設計が必要になる。ドキュメントとリポジトリの記載を参照し、用途に合わせて設定する。