Spaces:

daqc
/

hugging-research

Sleeping

App Files Files Community

hugging-research / scripts /hf_tools.py

daqc

Upload 61 files

b67af4a verified 2 months ago

raw

history blame

41 kB

	import json
	import time
	from typing import Dict, List, Optional, Tuple

	import requests
	from smolagents import Tool


	# -----------------------------
	# HTTP helpers (anonymous only)
	# -----------------------------

	DEFAULT_TIMEOUT = 15
	RETRY_STATUS = {429, 500, 502, 503, 504}


	def _anonymous_headers() -> Dict[str, str]:
	return {
	"Accept": "application/json",
	"User-Agent": "HuggingResearch-Agent/1.0 (+https://huggingface.co)",
	# No Authorization header on purpose (public only)
	}


	def _http_get_json(url: str, params: Optional[Dict] = None, max_retries: int = 2) -> Tuple[Optional[Dict \| List], int, str]:
	last_err = ""
	for attempt in range(max_retries + 1):
	try:
	resp = requests.get(url, params=params or {}, headers=_anonymous_headers(), timeout=DEFAULT_TIMEOUT)
	if resp.status_code == 200:
	try:
	return resp.json(), resp.status_code, ""
	except Exception as je:
	return None, resp.status_code, f"invalid_json: {je}"
	if resp.status_code in {401, 403}:
	# Private/Gated/Unauthorized
	return None, resp.status_code, "no_access"
	if resp.status_code in RETRY_STATUS and attempt < max_retries:
	time.sleep(1.0 * (attempt + 1))
	continue
	return None, resp.status_code, f"http_{resp.status_code}"
	except Exception as e:
	last_err = str(e)
	if attempt < max_retries:
	time.sleep(0.8 * (attempt + 1))
	continue
	return None, 0, f"exception: {last_err}"


	# -----------------------------
	# Normalization helpers
	# -----------------------------

	def _visibility_from_item(item: Dict) -> Tuple[str, str]:
	if not isinstance(item, dict):
	return "public", "accessible"
	if item.get("private") is True:
	return "private", "no_access"
	if item.get("gated") is True or item.get("gatedReason") or (isinstance(item.get("cardData"), dict) and item["cardData"].get("gated")):
	return "gated", "no_access"
	return "public", "accessible"


	def _norm_common(item_id: str, item_type: str, owner: str, description: str = "", url_suffix: str = "") -> Dict:
	url = f"https://huggingface.co/{url_suffix}{item_id}" if url_suffix else f"https://huggingface.co/{item_id}"
	return {
	"type": item_type,
	"id": item_id,
	"owner": owner,
	"url": url,
	"description": description or "",
	}


	def _safe_get(item: Dict, key: str, default=None):
	return item.get(key, default) if isinstance(item, dict) else default


	# -----------------------------
	# Tools
	# -----------------------------


	class HFModelsSearchTool(Tool):
	name = "hf_models_search"
	description = (
	"Search public Hugging Face models. Provide a free-text query and optional filters "
	"(owner, single pipeline_tag, tags CSV, sort/direction, limit). "
	"Prefer minimal params; add owner/task/tags/sort only when the user implies them. "
	"Defaults: limit=10, sort omitted, direction omitted. Returns JSON with `results`, `status`, `error`, and `params`."
	)
	inputs = {
	"query": {"type": "string", "description": "Free-text search", "nullable": True},
	"owner": {"type": "string", "description": "Filter by owner/namespace", "nullable": True},
	"task": {"type": "string", "description": "Primary pipeline tag, e.g. text-classification", "nullable": True},
	"tags": {"type": "string", "description": "Comma-separated tags filter", "nullable": True},
	"sort": {"type": "string", "description": "downloads\|likes\|modified", "nullable": True},
	"direction": {"type": "string", "description": "descending\|ascending", "nullable": True},
	"limit": {"type": "number", "description": "Max results", "nullable": True},
	}
	output_type = "string"

	def forward(self, query: Optional[str] = None, owner: Optional[str] = None, task: Optional[str] = None, tags: Optional[str] = None, sort: Optional[str] = None, direction: Optional[str] = None, limit: Optional[int] = None) -> str:
	# Build conservative params
	params = {}
	if query:
	params["search"] = query
	if owner:
	params["author"] = owner
	if task:
	# pipeline_tag must be a single value; if multiple provided, take the first
	first_task = task.split(",")[0].strip()
	if first_task:
	params["pipeline_tag"] = first_task
	if tags:
	# Support comma-separated → repeated tags
	tag_list = [t.strip() for t in tags.split(",") if t.strip()]
	if len(tag_list) == 1:
	params["tags"] = tag_list[0]
	elif len(tag_list) > 1:
	params["tags"] = tag_list # requests will repeat param
	# Support 'trending' as an alias mapped to downloads+descending for recency/interest
	if sort in {"downloads", "likes", "modified", "trending"}:
	params["sort"] = sort
	if sort == "trending":
	params["sort"] = "downloads"
	params["direction"] = "descending"
	elif direction in {"descending", "ascending"}:
	params["direction"] = direction
	# Default limit to 10 if not specified
	lim = int(limit) if limit else 10
	params["limit"] = lim

	data, status, err = _http_get_json("https://huggingface.co/api/models", params)
	# Fallback: retry with minimal params if 400
	if status == 400:
	minimal = {"search": query} if query else {}
	if limit:
	minimal["limit"] = int(limit)
	data, status, err = _http_get_json("https://huggingface.co/api/models", minimal)
	results: List[Dict] = []
	if isinstance(data, list):
	for it in data:
	model_id = _safe_get(it, "id") or _safe_get(it, "modelId") or ""
	if not model_id:
	continue
	owner_name = model_id.split("/")[0] if "/" in model_id else ""
	desc = ""
	# If present, short description may live in cardData/summary when full=true; not guaranteed in list
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(model_id, "model", owner_name, desc)
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"task": _safe_get(it, "pipeline_tag"),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	results.append(norm)

	return json.dumps({
	"results": results,
	"status": status,
	"error": err,
	"params": params,
	}, ensure_ascii=False)


	class HFModelInfoTool(Tool):
	name = "hf_model_info"
	description = (
	"Get detailed public model info by repo id (owner/name). Use this after a model search to fetch richer metadata (cardData, siblings, tags)."
	)
	inputs = {
	"repo_id": {"type": "string", "description": "Model repo id, e.g. bigscience/bloom"}
	}
	output_type = "string"

	def forward(self, repo_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/models/{repo_id}", {"full": "true"})
	item: Dict = {}
	if isinstance(data, dict):
	model_id = data.get("id") or data.get("modelId") or repo_id
	owner_name = model_id.split("/")[0] if "/" in model_id else ""
	visibility, access = _visibility_from_item(data)
	desc = ""
	# Some cards put a short summary in cardData/summary
	if isinstance(data.get("cardData"), dict):
	desc = data["cardData"].get("summary") or data["cardData"].get("description") or ""
	item = _norm_common(model_id, "model", owner_name, desc)
	item.update({
	"tags": data.get("tags", []),
	"task": data.get("pipeline_tag"),
	"likes": data.get("likes", 0),
	"downloads": data.get("downloads", 0),
	"updatedAt": data.get("lastModified"),
	"visibility": visibility,
	"access": access,
	"cardData": data.get("cardData"),
	"siblings": data.get("siblings"),
	})
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFDatasetsSearchTool(Tool):
	name = "hf_datasets_search"
	description = (
	"Search public datasets with a free-text query and optional filters (owner, tags CSV, sort/direction, limit). "
	"Prefer minimal params; add filters when implied. Defaults: limit=10. Returns JSON with `results`, `status`, `error`, and `params`."
	)
	inputs = {
	"query": {"type": "string", "description": "Free-text search", "nullable": True},
	"owner": {"type": "string", "description": "Filter by owner/namespace", "nullable": True},
	"tags": {"type": "string", "description": "Comma-separated tags filter", "nullable": True},
	"sort": {"type": "string", "description": "downloads\|likes\|modified", "nullable": True},
	"direction": {"type": "string", "description": "descending\|ascending", "nullable": True},
	"limit": {"type": "number", "description": "Max results", "nullable": True},
	}
	output_type = "string"

	def forward(self, query: Optional[str] = None, owner: Optional[str] = None, tags: Optional[str] = None, sort: Optional[str] = None, direction: Optional[str] = None, limit: Optional[int] = None) -> str:
	params = {}
	if query:
	params["search"] = query
	if owner:
	params["author"] = owner
	if tags:
	tag_list = [t.strip() for t in tags.split(",")] if isinstance(tags, str) else []
	tag_list = [t for t in tag_list if t]
	if len(tag_list) == 1:
	params["tags"] = tag_list[0]
	elif len(tag_list) > 1:
	params["tags"] = tag_list
	if sort in {"downloads", "likes", "modified", "trending"}:
	params["sort"] = sort
	if sort == "trending":
	params["sort"] = "downloads"
	params["direction"] = "descending"
	elif direction in {"descending", "ascending"}:
	params["direction"] = direction
	lim = int(limit) if limit else 10
	params["limit"] = lim

	data, status, err = _http_get_json("https://huggingface.co/api/datasets", params)
	if status == 400:
	minimal = {"search": query} if query else {}
	if limit:
	minimal["limit"] = int(limit)
	data, status, err = _http_get_json("https://huggingface.co/api/datasets", minimal)
	results: List[Dict] = []
	if isinstance(data, list):
	for it in data:
	ds_id = _safe_get(it, "id") or _safe_get(it, "datasetId") or ""
	if not ds_id:
	continue
	owner_name = ds_id.split("/")[0] if "/" in ds_id else ""
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(ds_id, "dataset", owner_name, "")
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	results.append(norm)
	return json.dumps({"results": results, "status": status, "error": err, "params": params}, ensure_ascii=False)


	class HFDatasetInfoTool(Tool):
	name = "hf_dataset_info"
	description = (
	"Get detailed public dataset info by repo id (owner/name). Use after a dataset search to retrieve cardData and siblings."
	)
	inputs = {"repo_id": {"type": "string", "description": "Dataset repo id, e.g. glue"}}
	output_type = "string"

	def forward(self, repo_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/datasets/{repo_id}", {"full": "true"})
	item: Dict = {}
	if isinstance(data, dict):
	ds_id = data.get("id") or data.get("datasetId") or repo_id
	owner_name = ds_id.split("/")[0] if "/" in ds_id else ""
	visibility, access = _visibility_from_item(data)
	desc = ""
	if isinstance(data.get("cardData"), dict):
	desc = data["cardData"].get("summary") or data["cardData"].get("description") or ""
	item = _norm_common(ds_id, "dataset", owner_name, desc)
	item.update({
	"tags": data.get("tags", []),
	"likes": data.get("likes", 0),
	"downloads": data.get("downloads", 0),
	"updatedAt": data.get("lastModified"),
	"visibility": visibility,
	"access": access,
	"cardData": data.get("cardData"),
	"siblings": data.get("siblings"),
	})
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFSpacesSearchTool(Tool):
	name = "hf_spaces_search"
	description = (
	"Search public Spaces with query and optional filters (owner, tags CSV, sort/direction, limit). "
	"Good for tutorials/demos related to a topic. Defaults: limit=10. Returns JSON with `results`, `status`, `error`, and `params`."
	)
	inputs = {
	"query": {"type": "string", "description": "Free-text search", "nullable": True},
	"owner": {"type": "string", "description": "Filter by owner/namespace", "nullable": True},
	"tags": {"type": "string", "description": "Comma-separated tags filter", "nullable": True},
	"sort": {"type": "string", "description": "likes\|modified", "nullable": True},
	"direction": {"type": "string", "description": "descending\|ascending", "nullable": True},
	"limit": {"type": "number", "description": "Max results", "nullable": True},
	}
	output_type = "string"

	def forward(self, query: Optional[str] = None, owner: Optional[str] = None, tags: Optional[str] = None, sort: Optional[str] = None, direction: Optional[str] = None, limit: Optional[int] = None) -> str:
	params = {}
	if query:
	params["search"] = query
	if owner:
	params["author"] = owner
	if tags:
	tag_list = [t.strip() for t in tags.split(",")] if isinstance(tags, str) else []
	tag_list = [t for t in tag_list if t]
	if len(tag_list) == 1:
	params["tags"] = tag_list[0]
	elif len(tag_list) > 1:
	params["tags"] = tag_list
	if sort in {"likes", "modified", "trending"}:
	params["sort"] = sort
	if sort == "trending":
	params["sort"] = "likes"
	params["direction"] = "descending"
	elif direction in {"descending", "ascending"}:
	params["direction"] = direction
	lim = int(limit) if limit else 10
	params["limit"] = lim

	data, status, err = _http_get_json("https://huggingface.co/api/spaces", params)
	if status == 400:
	minimal = {"search": query} if query else {}
	if limit:
	minimal["limit"] = int(limit)
	data, status, err = _http_get_json("https://huggingface.co/api/spaces", minimal)
	results: List[Dict] = []
	if isinstance(data, list):
	for it in data:
	sp_id = _safe_get(it, "id") or _safe_get(it, "spaceId") or ""
	if not sp_id:
	continue
	owner_name = sp_id.split("/")[0] if "/" in sp_id else ""
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(sp_id, "space", owner_name, "")
	# Try to extract Space runtime (sdk, app file) when available in list
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	results.append(norm)
	return json.dumps({"results": results, "status": status, "error": err, "params": params}, ensure_ascii=False)


	class HFSpaceInfoTool(Tool):
	name = "hf_space_info"
	description = (
	"Get detailed Space info by repo id (owner/name). Use to inspect tags, likes, and card details after a Space search."
	)
	inputs = {"repo_id": {"type": "string", "description": "Space repo id, e.g. user/space-name"}}
	output_type = "string"

	def forward(self, repo_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/spaces/{repo_id}", {"full": "true"})
	item: Dict = {}
	if isinstance(data, dict):
	sp_id = data.get("id") or data.get("spaceId") or repo_id
	owner_name = sp_id.split("/")[0] if "/" in sp_id else ""
	visibility, access = _visibility_from_item(data)
	desc = ""
	if isinstance(data.get("cardData"), dict):
	desc = data["cardData"].get("summary") or data["cardData"].get("description") or ""
	item = _norm_common(sp_id, "space", owner_name, desc)
	item.update({
	"tags": data.get("tags", []),
	"likes": data.get("likes", 0),
	"downloads": data.get("downloads", 0),
	"updatedAt": data.get("lastModified"),
	"visibility": visibility,
	"access": access,
	"cardData": data.get("cardData"),
	"siblings": data.get("siblings"),
	})
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFUserInfoTool(Tool):
	name = "hf_user_info"
	description = (
	"Fetch public user/org profile by username. Helpful to scope searches by owner or explore maintainers."
	)
	inputs = {"username": {"type": "string", "description": "User or organization name"}}
	output_type = "string"

	def forward(self, username: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/users/{username}")
	item = data if isinstance(data, dict) else {}
	visibility = "public"
	access = "accessible" if status == 200 else "no_access"
	return json.dumps({"item": item, "status": status, "error": err, "visibility": visibility, "access": access}, ensure_ascii=False)


	class HFCollectionsListTool(Tool):
	name = "hf_collections_list"
	description = (
	"List public collections, optionally filtered by owner/namespace. Use to surface curated sets of repos. "
	"Owner may be an object; URL is normalized to https://huggingface.co/collections/{owner_name}/{slug}."
	)
	inputs = {"owner": {"type": "string", "description": "Filter by collection owner/namespace", "nullable": True}}
	output_type = "string"

	def forward(self, owner: Optional[str] = None) -> str:
	params = {}
	if owner:
	params["owner"] = owner
	data, status, err = _http_get_json("https://huggingface.co/api/collections", params)
	results = data if isinstance(data, list) else []
	# Normalize minimally
	items: List[Dict] = []
	for it in results:
	cid = _safe_get(it, "id") or _safe_get(it, "slug") or ""
	ns_val = _safe_get(it, "owner") or _safe_get(it, "namespace") or ""
	if isinstance(ns_val, dict):
	ns = ns_val.get("name") or ns_val.get("fullname") or ""
	else:
	ns = ns_val
	url = ""
	if ns and cid:
	# Some APIs return id as "{namespace}/{slug}", so extract slug part only
	slug = cid.split("/")[-1]
	url = f"https://huggingface.co/collections/{ns}/{slug}"
	items.append({
	"type": "collection",
	"id": cid,
	"owner": ns,
	"title": _safe_get(it, "title", ""),
	"url": url,
	"visibility": "public",
	"access": "accessible",
	})
	return json.dumps({"results": items, "status": status, "error": err}, ensure_ascii=False)


	class HFCollectionGetTool(Tool):
	name = "hf_collection_get"
	description = (
	"Get collection details by namespace and slug id (as in URL). Use after listing to inspect items."
	)
	inputs = {
	"namespace": {"type": "string", "description": "Collection owner/namespace"},
	"slug_id": {"type": "string", "description": "slug-id part as shown in URL"},
	}
	output_type = "string"

	def forward(self, namespace: str, slug_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/collections/{namespace}/{slug_id}")
	item = data if isinstance(data, dict) else {}
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFPaperInfoTool(Tool):
	name = "hf_paper_info"
	description = (
	"Fetch paper metadata by arXiv id (e.g., 1706.03762). Combine with hf_paper_repos to find related repos."
	)
	inputs = {"arxiv_id": {"type": "string", "description": "arXiv identifier, e.g. 1706.03762"}}
	output_type = "string"

	def forward(self, arxiv_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/papers/{arxiv_id}")
	item = data if isinstance(data, dict) else {}
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFPaperReposTool(Tool):
	name = "hf_paper_repos"
	description = (
	"List repos (models/datasets/spaces) referencing an arXiv id. Use alongside hf_paper_info to map research → repos."
	)
	inputs = {"arxiv_id": {"type": "string", "description": "arXiv identifier, e.g. 1706.03762"}}
	output_type = "string"

	def forward(self, arxiv_id: str) -> str:
	data, status, err = _http_get_json(f"https://huggingface.co/api/arxiv/{arxiv_id}/repos")
	results = data if isinstance(data, list) else []
	return json.dumps({"results": results, "status": status, "error": err}, ensure_ascii=False)


	class HFDailyPapersTool(Tool):
	name = "hf_daily_papers"
	description = (
	"Get the daily curated papers list from Hugging Face. Useful for current research trends."
	)
	inputs = {}
	output_type = "string"

	def forward(self) -> str: # type: ignore[override]
	data, status, err = _http_get_json("https://huggingface.co/api/daily_papers")
	results = data if isinstance(data, list) else []
	return json.dumps({"results": results, "status": status, "error": err}, ensure_ascii=False)


	class HFRepoInfoTool(Tool):
	name = "hf_repo_info"
	description = (
	"Generic repo info for model\|dataset\|space by id. Use if you already know the type and want raw item metadata."
	)
	inputs = {
	"repo_type": {"type": "string", "description": "model\|dataset\|space"},
	"repo_id": {"type": "string", "description": "Owner/name or id"},
	}
	output_type = "string"

	def forward(self, repo_type: str, repo_id: str) -> str:
	repo_type = (repo_type or "").strip().lower()
	if repo_type not in {"model", "dataset", "space"}:
	return json.dumps({"error": "invalid_repo_type", "status": 400})
	base = {"model": "models", "dataset": "datasets", "space": "spaces"}[repo_type]
	data, status, err = _http_get_json(f"https://huggingface.co/api/{base}/{repo_id}", {"full": "true"})
	item = data if isinstance(data, dict) else {}
	return json.dumps({"item": item, "status": status, "error": err}, ensure_ascii=False)


	class HFSiteSearchTool(Tool):
	name = "hf_site_search"
	description = (
	"Search within huggingface.co for blogs, Learn pages, and posts (DuckDuckGo). Prefer this for tutorials and docs not covered by Hub APIs. "
	"Defaults: limit=10 to reduce rate limiting. Returns JSON with `results`, `status`, and `error`."
	)
	inputs = {
	"query": {"type": "string", "description": "Search query. 'site:huggingface.co' will be added if missing."},
	"limit": {"type": "number", "description": "Max results (default 20)", "nullable": True},
	}
	output_type = "string"

	def forward(self, query: str, limit: Optional[int] = None) -> str:
	try:
	from duckduckgo_search import DDGS
	except Exception:
	return json.dumps({"results": [], "status": 500, "error": "duckduckgo_search_not_installed"})

	q = f"site:huggingface.co {query}" if "huggingface.co" not in query else query
	lim = int(limit) if limit else 10
	results: List[Dict] = []
	try:
	with DDGS() as ddgs:
	for r in ddgs.text(q, safesearch="moderate", timelimit=None, max_results=lim):
	if not isinstance(r, dict):
	continue
	results.append({
	"type": "site",
	"title": r.get("title"),
	"url": r.get("href"),
	"snippet": r.get("body"),
	"date": r.get("date"),
	})
	except Exception as e:
	return json.dumps({"results": [], "status": 500, "error": str(e)})
	return json.dumps({"results": results, "status": 200, "error": ""}, ensure_ascii=False)


	class HFReportGenerateTool(Tool):
	name = "hf_report_generate"
	description = (
	"Generate a full HTML report from aggregated JSON (string). The app prefers its own dashboard, but this can render custom summaries."
	)
	inputs = {
	"data_json": {"type": "string", "description": "Aggregated search results JSON"},
	"title": {"type": "string", "description": "Report title", "nullable": True},
	}
	output_type = "string"

	def forward(self, data_json: str, title: Optional[str] = None) -> str:
	try:
	data = json.loads(data_json) if data_json else {}
	except Exception as e:
	data = {"parse_error": str(e)}
	title = title or "Hugging Face Research Report"

	def card_html(item: Dict) -> str:
	badge = ""
	vis = item.get("visibility")
	access = item.get("access")
	if vis in {"private", "gated"} or access == "no_access":
	badge = f"<span class=badge badge-warn>{vis or 'restricted'}</span>"
	meta = []
	if item.get("task"):
	meta.append(f"<span class=meta>Task: {item['task']}</span>")
	if item.get("tags"):
	meta.append(f"<span class=meta>Tags: {', '.join(item['tags'][:5])}</span>")
	if item.get("downloads") is not None:
	meta.append(f"<span class=stat>⬇️ {item['downloads']}</span>")
	if item.get("likes") is not None:
	meta.append(f"<span class=stat>❤️ {item['likes']}</span>")
	if item.get("updatedAt"):
	meta.append(f"<span class=meta>Updated: {item['updatedAt']}</span>")
	desc = (item.get("description") or "").strip()
	if len(desc) > 220:
	desc = desc[:217] + "..."
	return (
	"<div class=card>"
	f"<div class=card-title><a href='{item.get('url')}' target=_blank rel=noopener>{item.get('id')}</a> {badge}</div>"
	f"<div class=card-subtitle>{item.get('type','')} • {item.get('owner','')}</div>"
	f"<div class=card-desc>{desc}</div>"
	f"<div class=card-meta>{' \| '.join(meta)}</div>"
	"</div>"
	)

	def section(title_text: str, items: List[Dict]) -> str:
	if not items:
	return ""
	cards = "\n".join(card_html(it) for it in items)
	return f"<section><h2>{title_text}</h2><div class=cards>{cards}</div></section>"

	# Accept either a dict with category keys or a flat list
	models = data.get("models") or data.get("Models") or []
	datasets = data.get("datasets") or data.get("Datasets") or []
	spaces = data.get("spaces") or data.get("Spaces") or []
	papers = data.get("papers") or data.get("Papers") or []
	daily_papers = data.get("daily_papers") or data.get("DailyPapers") or []
	users = data.get("users") or data.get("Users") or []
	collections = data.get("collections") or data.get("Collections") or []
	site = data.get("site") or data.get("Site") or []

	html = f"""<!DOCTYPE html>
	<html lang=\"en\">
	<head>
	<meta charset=\"utf-8\" />
	<meta name=\"viewport\" content=\"width=device-width, initial-scale=1\" />
	<title>{title}</title>
	<style>
	:root {{ --bg:#0b0d12; --fg:#e6e9ef; --muted:#9aa4b2; --card:#121621; --accent:#5ac8fa; --warn:#eab308; }}
	body {{ background:var(--bg); color:var(--fg); font-family: ui-sans-serif, system-ui, -apple-system, Segoe UI, Roboto, Inter, Arial, sans-serif; margin:0; padding:24px; }}
	h1 {{ font-size: 24px; margin: 0 0 12px; }}
	h2 {{ font-size: 18px; margin: 24px 0 8px; color: var(--accent); }}
	.container {{ max-width: 1120px; margin: 0 auto; }}
	.subtitle {{ color: var(--muted); margin-bottom: 18px; }}
	.cards {{ display: grid; grid-template-columns: repeat(auto-fill, minmax(280px,1fr)); gap: 12px; }}
	.card {{ background: var(--card); border: 1px solid rgba(255,255,255,0.06); border-radius: 10px; padding: 12px; }}
	.card-title {{ font-weight: 600; margin-bottom: 4px; overflow-wrap:anywhere; }}
	.card-subtitle {{ color: var(--muted); font-size: 12px; margin-bottom: 8px; }}
	.card-desc {{ font-size: 13px; line-height: 1.45; min-height: 28px; margin-bottom: 8px; color: #d2d7df; }}
	.card-meta {{ font-size: 12px; color: var(--muted); display:flex; flex-wrap:wrap; gap:8px; }}
	.badge {{ background: rgba(234, 179, 8, 0.15); color: #facc15; border:1px solid rgba(250,204,21,0.35); border-radius: 999px; padding: 2px 8px; font-size: 11px; margin-left: 6px; }}
	.badge-warn {{ background: rgba(234, 179, 8, 0.15); }}
	a {{ color: #93c5fd; text-decoration: none; }}
	a:hover {{ text-decoration: underline; }}
	section {{ margin-bottom: 18px; }}
	</style>
	<script>
	function printToPDF() {{ window.print(); }}
	</script>
	<link rel=\"stylesheet\" href=\"https://cdnjs.cloudflare.com/ajax/libs/modern-normalize/2.0.0/modern-normalize.min.css\" />
	<meta name=\"robots\" content=\"noindex\" />
	<meta name=\"referrer\" content=\"no-referrer\" />
	<meta http-equiv=\"Content-Security-Policy\" content=\"default-src 'self' 'unsafe-inline' data: https://cdnjs.cloudflare.com; img-src * data:; style-src 'self' 'unsafe-inline' https://cdnjs.cloudflare.com;\" />
	</head>
	<body>
	<div class=\"container\">
	<div style=\"display:flex; align-items:center; justify-content:space-between; gap:12px;\">
	<div>
	<h1>{title}</h1>
	<div class=\"subtitle\">Generated by Hugging Search</div>
	</div>
	<button onclick=\"printToPDF()\" style=\"background:#1f2937;color:#e5e7eb;border:1px solid rgba(255,255,255,0.08);border-radius:8px;padding:8px 10px;cursor:pointer;\">Print to PDF</button>
	</div>
	{section("Models", models)}
	{section("Datasets", datasets)}
	{section("Spaces", spaces)}
	{section("Papers", papers)}
	{section("Daily Papers", daily_papers)}
	{section("Users", users)}
	{section("Collections", collections)}
	{section("Site results", site)}
	</div>
	</body>
	</html>
	"""
	return html


	class HFDashboardReportTool(Tool):
	name = "hf_generate_dashboard_report"
	description = (
	"One-click dashboard report from a query. Fetches public models/datasets/spaces/daily_papers and returns a full HTML dashboard."
	)
	inputs = {
	"query": {"type": "string", "description": "User intent / keywords to search across Hub"},
	"limit": {"type": "number", "description": "Max results per category (default 20)", "nullable": True},
	}
	output_type = "string"

	def forward(self, query: str, limit: Optional[int] = None) -> str:
	lim = int(limit) if limit else 20
	params_common = {"search": query, "sort": "downloads", "direction": "descending", "limit": lim}
	# Fetch categories
	m_data, m_status, _ = _http_get_json("https://huggingface.co/api/models", params_common)
	d_data, d_status, _ = _http_get_json("https://huggingface.co/api/datasets", params_common)
	s_data, s_status, _ = _http_get_json("https://huggingface.co/api/spaces", {"search": query, "sort": "likes", "direction": "descending", "limit": lim})
	dp_data, dp_status, _ = _http_get_json("https://huggingface.co/api/daily_papers")

	models: List[Dict] = []
	if isinstance(m_data, list):
	for it in m_data[:lim]:
	model_id = _safe_get(it, "id") or _safe_get(it, "modelId") or ""
	if not model_id:
	continue
	owner_name = model_id.split("/")[0] if "/" in model_id else ""
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(model_id, "model", owner_name, "")
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"task": _safe_get(it, "pipeline_tag"),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	models.append(norm)

	datasets: List[Dict] = []
	if isinstance(d_data, list):
	for it in d_data[:lim]:
	ds_id = _safe_get(it, "id") or _safe_get(it, "datasetId") or ""
	if not ds_id:
	continue
	owner_name = ds_id.split("/")[0] if "/" in ds_id else ""
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(ds_id, "dataset", owner_name, "")
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	datasets.append(norm)

	spaces: List[Dict] = []
	if isinstance(s_data, list):
	for it in s_data[:lim]:
	sp_id = _safe_get(it, "id") or _safe_get(it, "spaceId") or ""
	if not sp_id:
	continue
	owner_name = sp_id.split("/")[0] if "/" in sp_id else ""
	visibility, access = _visibility_from_item(it)
	norm = _norm_common(sp_id, "space", owner_name, "")
	norm.update({
	"tags": _safe_get(it, "tags", []),
	"likes": _safe_get(it, "likes", 0),
	"downloads": _safe_get(it, "downloads", 0),
	"updatedAt": _safe_get(it, "lastModified"),
	"visibility": visibility,
	"access": access,
	})
	spaces.append(norm)

	papers = dp_data if isinstance(dp_data, list) else []

	# Build dashboard HTML
	def card_html(item: Dict) -> str:
	badge = ""
	if item.get("visibility") in {"private", "gated"} or item.get("access") == "no_access":
	badge = f"<span class=badge badge-warn>{item.get('visibility','restricted')}</span>"
	meta = []
	if item.get("task"):
	meta.append(f"<span class=meta>Task: {item['task']}</span>")
	if item.get("tags"):
	meta.append(f"<span class=meta>Tags: {', '.join(item['tags'][:5])}</span>")
	if item.get("downloads") is not None:
	meta.append(f"<span class=stat>⬇️ {item['downloads']}</span>")
	if item.get("likes") is not None:
	meta.append(f"<span class=stat>❤️ {item['likes']}</span>")
	if item.get("updatedAt"):
	meta.append(f"<span class=meta>Updated: {item['updatedAt']}</span>")
	desc = (item.get("description") or "").strip()
	if len(desc) > 200:
	desc = desc[:197] + "..."
	return (
	"<div class=card>"
	f"<div class=card-title><a href='{item.get('url')}' target=_blank rel=noopener>{item.get('id')}</a> {badge}</div>"
	f"<div class=card-subtitle>{item.get('type','')} • {item.get('owner','')}</div>"
	f"<div class=card-desc>{desc}</div>"
	f"<div class=card-meta>{' \| '.join(meta)}</div>"
	"</div>"
	)

	def section(title_text: str, items: List[Dict]) -> str:
	if not items:
	return ""
	cards = "\n".join(card_html(it) for it in items)
	return f"<section><h2>{title_text}</h2><div class=cards>{cards}</div></section>"

	html = f"""<!DOCTYPE html>
	<html lang=\"en\">
	<head>
	<meta charset=\"utf-8\" />
	<meta name=\"viewport\" content=\"width=device-width, initial-scale=1\" />
	<title>Hugging Search — Dashboard</title>
	<style>
	:root {{ --bg:#0b0d12; --fg:#e6e9ef; --muted:#9aa4b2; --card:#121621; --accent:#5ac8fa; --warn:#eab308; }}
	body {{ background:var(--bg); color:var(--fg); font-family: ui-sans-serif, system-ui, -apple-system, Segoe UI, Roboto, Inter, Arial, sans-serif; margin:0; padding:24px; }}
	.container {{ max-width: 1200px; margin: 0 auto; }}
	.header {{ display:flex; justify-content:space-between; align-items:center; gap:12px; margin-bottom: 16px; }}
	.title {{ font-size: 22px; margin: 0; }}
	.subtitle {{ color: var(--muted); }}
	.stats {{ display:flex; gap:10px; flex-wrap:wrap; margin: 8px 0 18px; }}
	.stat-chip {{ background: var(--card); border: 1px solid rgba(255,255,255,0.08); border-radius: 999px; padding: 6px 10px; font-size: 12px; color: var(--muted); }}
	.cards {{ display: grid; grid-template-columns: repeat(auto-fill, minmax(280px,1fr)); gap: 12px; }}
	.card {{ background: var(--card); border: 1px solid rgba(255,255,255,0.06); border-radius: 10px; padding: 12px; }}
	.card-title {{ font-weight: 600; margin-bottom: 4px; overflow-wrap:anywhere; }}
	.card-subtitle {{ color: var(--muted); font-size: 12px; margin-bottom: 8px; }}
	.card-desc {{ font-size: 13px; line-height: 1.45; min-height: 28px; margin-bottom: 8px; color: #d2d7df; }}
	.card-meta {{ font-size: 12px; color: var(--muted); display:flex; flex-wrap:wrap; gap:8px; }}
	.badge {{ background: rgba(234, 179, 8, 0.15); color: #facc15; border:1px solid rgba(250,204,21,0.35); border-radius: 999px; padding: 2px 8px; font-size: 11px; margin-left: 6px; }}
	h2 {{ font-size: 16px; margin: 18px 0 8px; color: var(--accent); }}
	.actions {{ display:flex; gap:8px; align-items:center; }}
	button {{ background:#1f2937;color:#e5e7eb;border:1px solid rgba(255,255,255,0.08);border-radius:8px;padding:8px 10px;cursor:pointer; }}
	</style>
	<script>
	function printToPDF() {{ window.print(); }}
	</script>
	</head>
	<body>
	<div class=\"container\">
	<div class=\"header\">
	<div>
	<div class=\"title\">Hugging Search — Dashboard</div>
	<div class=\"subtitle\">Query: {query}</div>
	</div>
	<div class=\"actions\"><button onclick=\"printToPDF()\">Print to PDF</button></div>
	</div>
	<div class=\"stats\">
	<div class=\"stat-chip\">Models: {len(models)}</div>
	<div class=\"stat-chip\">Datasets: {len(datasets)}</div>
	<div class=\"stat-chip\">Spaces: {len(spaces)}</div>
	<div class=\"stat-chip\">Daily papers: {len(papers) if isinstance(papers,list) else 0}</div>
	</div>
	{section("Models", models)}
	{section("Datasets", datasets)}
	{section("Spaces", spaces)}
	</div>
	</body>
	</html>
	"""
	return html