美国

人工智能 AI工具人工智能

Crawl4AI：开源 LLM 友好型 Web 爬虫和抓取工具

Crawl4AI 是一款开源的 LLM 友好型 Web 爬虫工具，旨在简化异步 Web 爬取和数据提取，专为大型语言模型 (LLM) 和 AI 应用程序设计。它可以作为 Python 包或通过 Docker 安装，提供……

链接直达手机查看

其他站点: GitHub开源

Crawl4AI是什么

Cr awl4AI 是一款开源的 LLM 友好型 Web 爬虫工具，旨在简化异步 Web 爬取和数据提取，专为大型语言模型 (LLM) 和 AI 应用程序设计。它可以作为 Python 包或通过 Docker 安装，提供灵活的使用方式。Crawl4AI 的主要特点包括支持多 URL 并行爬取、提取所有媒体标签、外部和内部链接、元数据等。它支持自定义钩子、用户代理、页面截图、JavaScript 执行，并能生成结构化的输出，适合各种复杂的爬取场景，工具还具备异步架构和隐私保护功能。

Crawl4AI特点

🆓 完全免费且开源
🚀 性能超快，超越许多付费服务
🤖 LLM 友好的输出格式（JSON、清理的 HTML、markdown）
🌍 支持同时抓取多个 URL
🎨 提取并返回所有媒体标签（图像、音频和视频）
🔗 提取所有外部和内部链接
📚 从页面中提取元数据
🔄 爬取之前用于身份验证、标头和页面修改的自定义钩子
🕵️ 用户代理自定义
🖼️ 截取页面截图
📜 抓取前执行多个自定义 JavaScript
📊 使用 JsonCssExtractionStrategy 生成无需 LLM 的结构化输出
📚 各种分块策略：基于主题、正则表达式、句子等
🧠 高级提取策略：余弦聚类、LLM 等
🎯 CSS 选择器支持精确的数据提取
📝 传递指令/关键字以优化提取
🔒 代理支持，增强隐私和访问
🔄 针对复杂的多页面爬取场景的会话管理
🌐 异步架构，提高性能和可扩展性

资源下载此资源仅限注册用户下载，请先

相关导航

Sora 2 App 新版 Sora 应用将您的创意转化为动态和音效都超级逼真的视频

Sora 是一种新型创意应用程序，它利用 OpenAI 的最新进展将文本提示和图像转换为带有声音的超现实视频。一句话可以展开成电影场景、动漫短片或朋友视频的混音。如果你能写出来，你就可以看到它，重新混合它，分享它。与 Sora 一起将您的文字变成世界。

ConsolidatedID：具有多模式细粒度身份保护的肖像生成

ConsolidatedID：具有多模式细粒度身份保留的肖像生成，是一个面部一致性生成项目，给定一些输入 ID 的图像， ConsistentID 可以仅使用单个图像，根据文本提示生成各种个性化 ID 图像，人像生成具有极高的ID保真度，不牺牲多样性、文本可控性，几秒钟内快速定制，无需额外的 LoRA 培训。

腾讯混元大模型是由腾讯研发的大语言模型

腾讯混元大模型是由腾讯研发的大语言模型，具备跨领域知识和自然语言理解能力，实现基于人机自然语言对话的方式，理解用户指令并执行任务，帮助用户实现人获取信息，知识和灵感。

金数据5在线考试系统-在线AI出题 AI自动生成题库工具

金数据5在线考试系统是一款在线AI出题 AI自动生成题库工具，由 AI 驱动的新时代考试软件，可一键导入文本，智能解析生成题库，并在30秒内自动完成出题组卷工作。目前支持三种出题方式，上传题库创建、一句话创建和知识库创建，让企业更快组织考试，轻松管理、分析考试结果，科学评估员工表现。可用于招聘考试、培训考试、知识竞赛、技能测评等多场景。

文心一言 AI智能聊天机器人，是百度全新一代的知识增强大语言模型

百度的「文心一言」AI智能聊天机器人，是全新一代的知识增强大语言模型，能够和你聊天互动、回答问题、帮你创作，真的是非常方便。文心一言可以生成各种形式的内容，比如文本、图片、音频、视频，而且还能够理解各种语言和文化，具备跨模态、跨语言的深度语义理解与生成能力，功能非常强大。

Chinese Feng Shui 人工智能AI中国风水测算工具

Chinese Feng Shui是一款AI中国风水测算工具，提供可以使用中国风水测算、易经占卜、生辰八字算命、梅花命理学、房屋布局风水推算、五行姓名推算、八字生辰推算、紫微斗数等工具服务，通过中国风水在线测算工具，结合AI智能分析，准确预测风水能量，帮助你优化居家或商业环境，提升运势和福祉，打开官网即可非常方便。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...