Tech Collector MCP
Collects and summarizes technical articles from sources like Qiita, Dev.to, NewsAPI, and Hacker News using the Gemini API.
📰 tech-collector-mcp
Qiita × MCP × Gemini — AI クライアントから呼び出せる “技術記事収集・要約 & Notion 連携” プロトタイプ
✨ What’s this?
tech-collector-mcp は MCP (Model Context Protocol) を使い、複数ソース(Qiita/Dev.to/NewsAPI/Hacker News)から技術記事を一括取得し、Gemini API で要約、Notion データベースへ自動同期まで行う CLI ベースの実験プロジェクト です。
AI-Powered Prototyping: ChatGPT や Claude を活用した迅速なプロトタイピングを実施しています。
| 機能 | 説明 |
|---|---|
| Zero‑Server | JSON‑RPC over STDIO — Web サーバー不要 |
| Multi‑Source | Qiita/Dev.to/NewsAPI.org/Hacker News API を横断ラップ |
| Summarize | URL 要約 (summarizeUrlArticle) & Qiita 特化要約 |
| Aggregate | 全ソース取得 (fetchAllArticles) & 一括 Notion 同期 (aggregateArticles) |
| Recommend | 読了 × 評価 × タグベースの簡易レコメンド (recommendArticles) |
| Easy Integration | Claude Desktop などで関数呼び出し感覚で利用可能 |
Prototyping Phase 🛠️ スキーマ & プロンプトは随時更新中。
🔧 Requirements
- Node.js 18.x 以上
- npm または yarn
.envは.env.exampleを参照して作成
# ==== API Keys & Tokens ====
GEMINI_API_KEY=your_gemini_api_key_here # Google Generative AI
NEWSAPI_KEY=your_newsapi_api_key_here # NewsAPI.org
QIITA_TOKEN=your_qiita_token_here # Qiita (optional)
# ==== Pagination Settings ====
PAGE_LIMIT=3 # デフォルト取得件数/サービス
ITEMS_PER_PAGE=10 # ページネーション単位
# ==== Notion Integration ====
NOTION_API_KEY=your_notion_api_key_here # Notion Integration Token
NOTION_DATABASE_ID=your_database_id_here # 記事保存用DB ID
Dev.to/Hacker News は API キー不要です。
📦 Installation / Quick Start
# 1) Clone
$ git clone https://github.com/RuumaLilja/tech-collector-mcp.git
$ cd tech-collector-mcp
# 2) Install dependencies
$ npm install # または yarn install
# 3) Setup environment
$ cp .env.example .env
# .env を編集して各種キーを入力
# 4) Run MCP server (STDIO mode)
$ node src/index.js
🛠️ Using with Claude Desktop
settings.json に MCP サーバーを登録:
{
"mcpServers": {
"tech-collector": {
"command": "node",
"args": ["/absolute/path/to/tech-collector-mcp/src/index.js"]
}
}
}
起動後、チャット例:
Dev.toでreactタグの記事を3件取得して
最新テックニュースを取得して
Hacker Newsのトップ技術ネタを5件
https://example.com/article を要約して
取得した記事を Notion に保存して
全ソースを取得して Notion に同期して
全部まとめて最新技術記事を取得して
おすすめ記事(パーソナライズ推薦)を5件教えて```
📂 Project Structure
tech-collector-mcp/
├── adapters/
│ └── notionSdkStorage.js # Notion SDK 実装 (StoragePort)
├── clients/
│ ├── devtoClient.js
│ ├── geminiClient.js
│ ├── hackerNewsClient.js
│ ├── newsApiClient.js
│ └── qiitaClient.js
├── config/
│ ├── constants.js
│ ├── environment.js
│ ├── prompts.js # プロンプト定義
│ ├── toolDefinitions.dynamic.js# Notionスキーマ連動ツール
│ └── toolDefinitions.static.js # 静的ツール定義
├── ports/
│ └── storage.js # StoragePort インターフェース
├── services/
│ ├── aggregatorService.js # 全ソース取得→Notion同期
│ ├── devtoService.js
│ ├── fetchService.js # 全ソース取得
│ ├── hackerNewsService.js
│ ├── newsApiService.js
│ ├── qiitaRanking.js
│ ├── recommenderService.js # 読了×評価×タグベース推薦
│ ├── reportService.js # 同期結果レポート
│ ├── summarizeService.js # URL要約
│ ├── syncBatchService.js # Notion並列同期
│ └── syncService.js # 単一記事同期
├── utils/
│ ├── errors.js
│ ├── fieldMapper.js # 外部→Notionフィールド変換
│ ├── rpcHelpers.js
│ └── simhash.js # URL→SimHash (MD5)
└── index.js # エントリーポイント
📖 JSON‑RPC Overview
| Method | 説明 | Params | Returns |
initialize | MCP ハンドシェイク | — | capabilities.tools |
tools/list | 利用可能ツール一覧 | — | name, description, inputSchema |
tools/call | ツール実行 | name, arguments | 実行結果 (content[]) |
Main Tools (抜粋)
getQiitaRanking— Qiita 人気記事ランキング取得getDevtoArticles— Dev.to のタグ/検索記事取得getNewsApiArticles— NewsAPI.org からテックニュース取得getHackerNewsTopStories— Hacker News トップストーリー取得fetchAllArticles— 全ソースまとめて最新取得summarizeUrlArticle— 任意 URL 記事を Gemini で要約syncArticleToNotion— 記事を Notion に保存aggregateArticles— 全ソース取得 →Notion 一括同期recommendArticles— 読了 × 評価 × タグで簡易推薦
詳細は toolDefinitions.*.js を参照。
🩹 Troubleshooting
| エラー/症状 | 解決策 |
| Unsupported content type: json | MCP クライアントが type:'text' 以外のレスポンスを受信。ツール実装を確認 |
| 401 Unauthorized | .env の NEWSAPI_KEY または NOTION_API_KEY を確認 |
| ツールが呼ばれない | descriptionForModel/inputSchema を見直し、クライアント再起動 |
🗺 Roadmap
- Phase 1: Qiita ランキング+要約 (✅)
- Phase 2: マルチソース収集 (✅)
- Phase 3: Notion 連携 & パーソナライズ推薦 (✅)
- Phase 4: Slack 連携
- Phase 5: 定期バッチ
Related Servers
Bright Data
sponsorDiscover, extract, and interact with the web - one interface powering automated access across the public internet.
ScrapeGraph AI
AI-powered web scraping using the ScrapeGraph AI API. Requires an API key.
Selenium MCP Server
Control web browsers using the Selenium WebDriver for automation and testing.
Puppeteer Vision
Scrape webpages and convert them to markdown using Puppeteer. Features AI-driven interaction capabilities.
Oxylabs AI Studio
AI-powered tools for web scraping, crawling, and browser automation.
Kakuyomu MCP Server
An MCP server for the Kakuyomu novel posting site, enabling users to search for works, retrieve episode lists, and read content.
Daft.ie MCP Server
Search and retrieve rental property details from Daft.ie via web scraping.
Playwright
Provides browser automation capabilities using Playwright. Interact with web pages, take screenshots, and execute JavaScript in a real browser environment.
Yahoo Finance
Fetch stock data, news, and financial information from Yahoo Finance.
Playwright Server
Automate web browsers and perform web scraping tasks using the Playwright framework.
Stepstone
Fetches job listings from Stepstone.de based on keywords and location parameters.