Service

GitHub - philschmid/clipper.js: HTML to Markdown converter and crawler.

philschmid

2025.06.01

·GitHub·by Anonymous

#HTML#Markdown#CLI#Node.js#Web Scraping

Key Points

1Clipper.js is a Node.js command-line tool designed to extract and convert web page content into Markdown, serving as a terminal-based alternative to browser clipping extensions.
2Leveraging Mozilla Readability and Turndown, it supports clipping from URLs, HTML files, or directories, and also includes a crawling feature powered by Playwright and Crawlee for comprehensive site content capture.
3Beyond direct web clipping, Clipper.js can facilitate PDF to Markdown conversion by first converting PDFs to HTML, making it a versatile tool for digital content archival and note-taking.

<h1>

Service

philschmid

2025.06.01

·GitHub·by Anonymous

#HTML#Markdown#CLI#Node.js#Web Scraping

1Clipper.js is a Node.js command-line tool designed to extract and convert web page content into Markdown, serving as a terminal-based alternative to browser clipping extensions.
2Leveraging Mozilla Readability and Turndown, it supports clipping from URLs, HTML files, or directories, and also includes a crawling feature powered by Playwright and Crawlee for comprehensive site content capture.
3Beyond direct web clipping, Clipper.js can facilitate PDF to Markdown conversion by first converting PDFs to HTML, making it a versatile tool for digital content archival and note-taking.

<h1>