Protokoll #33889

ID	33889
Zeitstempel	2026-04-21 03:42:36.508831
Client	root
IP	62.246.34.195
Modell	claude-sonnet-4-20250514
Status	completed
Tokens	886 (Input: 40, Output: 846)
Dauer	62 ms
Request-Zeit	2026-04-21 03:42:36.508831
Response-Zeit	2026-04-21 03:42:36.570901

Request

{
    "event": "PreToolUse",
    "tool_name": "Read",
    "tool_input": {
        "file_path": "\/var\/www\/dev.campus.systemische-tools.de\/crawler\/src\/interfaces\/cli\/commands\/crawl.py"
    }
}

Response

{
    "tool_response": {
        "type": "text",
        "file": {
            "filePath": "\/var\/www\/dev.campus.systemische-tools.de\/crawler\/src\/interfaces\/cli\/commands\/crawl.py",
            "content": "from __future__ import annotations\n\nimport asyncio\nfrom collections.abc import Awaitable, Callable\nfrom dataclasses import dataclass\nfrom urllib.parse import urlsplit\n\nfrom src.application.use_cases.start_crawl import StartCrawlInput\nfrom src.domain.ports.http_fetcher_port import HttpFetcherPort\nfrom src.domain.value_objects.enums import CrawlMode, CrawlStatus, RenderMode, TriggerSource\nfrom src.infrastructure.config.constants import HTTP_CONCURRENCY, PLAYWRIGHT_CONCURRENCY\nfrom src.infrastructure.fetchers.httpx_fetcher import HttpxFetcher\nfrom src.infrastructure.fetchers.playwright_fetcher import PlaywrightFetcher\nfrom src.infrastructure.fetchers.playwright_http_adapter import PlaywrightHttpAdapter\nfrom src.interfaces.cli.wiring import Container\nfrom src.interfaces.cli.worker import QueueWorker, WorkerConfig\n\n\n@dataclass(frozen=True, slots=True)\nclass CrawlCliInput:\n    base_url: str\n    mode: CrawlMode\n    trigger: TriggerSource\n    concurrency: int = HTTP_CONCURRENCY\n    max_urls: int | None = None\n\n\n@dataclass(frozen=True, slots=True)\nclass _FetcherChoice:\n    fetcher: HttpFetcherPort\n    render_mode: RenderMode\n    concurrency: int\n    close: Callable[[], Awaitable[None]]\n\n\nasync def _build_fetcher(command: CrawlCliInput) -> _FetcherChoice:\n    if command.mode is CrawlMode.FAST:\n        http = HttpxFetcher.create()\n        return _FetcherChoice(http, RenderMode.HTTP, command.concurrency, http.close)\n    browser = await PlaywrightFetcher.create()\n    adapter = PlaywrightHttpAdapter(browser)\n    concurrency = min(command.concurrency, PLAYWRIGHT_CONCURRENCY)\n    return _FetcherChoice(adapter, RenderMode.PLAYWRIGHT, concurrency, browser.close)\n\n\nasync def run_crawl(container: Container, command: CrawlCliInput) -> int:\n    crawl = container.start_crawl().execute(\n        StartCrawlInput(\n            base_url=command.base_url,\n            mode=command.mode,\n            trigger_source=command.trigger,\n            config={},\n        ),\n    )\n    if crawl.id is None:\n        raise RuntimeError(\"start_crawl did not assign id\")\n    choice = await _build_fetcher(command)\n    registered_domain = urlsplit(command.base_url).hostname or \"\"\n    try:\n        process_uc = container.process_url(\n            choice.fetcher,\n            registered_domain=registered_domain,\n            render_mode=choice.render_mode,\n        )\n        worker = QueueWorker(\n            queue=container.queue,\n            process_url=process_uc,\n            errors=container.repos.errors,\n            clock=container.clock,\n        )\n        processed = await worker.run(\n            WorkerConfig(\n                crawl_id=crawl.id,\n                concurrency=choice.concurrency,\n                max_urls=command.max_urls,\n            )\n        )\n    finally:\n        await choice.close()\n    container.finalize().execute(\n        crawl_id=crawl.id,\n        status=CrawlStatus.COMPLETED,\n        total_urls=processed,\n    )\n    return crawl.id\n\n\ndef sync_run_crawl(container: Container, command: CrawlCliInput) -> int:\n    return asyncio.run(run_crawl(container, command))\n",
            "numLines": 90,
            "startLine": 1,
            "totalLines": 90
        }
    }
}

← Vorheriger Zur Liste Nächster →