รับข้อมูลส่วนหัว HTTP จากเว็บไซต์โดยใช้ curl

Anonim

วิธีที่ง่ายที่สุดในการรับข้อมูลส่วนหัว HTTP จากเว็บไซต์ใดๆ คือการใช้เครื่องมือบรรทัดคำสั่ง curl ไวยากรณ์ในการดึงส่วนหัวของเว็บไซต์จะเป็นดังนี้:

curl -I url

นั่นคือตัวพิมพ์ใหญ่ 'i' ไม่ใช่ตัว L ตัวพิมพ์เล็ก ตัวพิมพ์ใหญ่ i แยกเฉพาะข้อมูลส่วนหัว

ลองใช้ตัวคุณเองด้วยตัวอย่าง URL นี่คือตัวอย่างสตริงไวยากรณ์ที่ใช้ Google.com เป็นส่วนหัวของเว็บไซต์เพื่อดึงข้อมูล:

curl -I www.google.com

อีกครั้ง สิ่งสำคัญคือต้องทราบว่าตัว I เป็นตัวพิมพ์ใหญ่หากคุณต้องการเฉพาะส่วนหัวของไซต์ การใช้ตัวพิมพ์เล็ก i จะทำให้คุณมี HTML ที่ย่อขนาดพร้อมกับส่วนหัว เพียงเลื่อนขึ้นในหน้าต่างเทอร์มินัลไปยังบรรทัดที่ต่อจากคำสั่ง curl โดยตรงเพื่อค้นหาข้อมูลส่วนหัว HTTP

ตัวอย่างรายละเอียดส่วนหัว HTTP ที่ดึงโดย curl -I อาจมีลักษณะดังนี้:

วิธีง่ายๆ ในการหลีกเลี่ยง HTML, Javascript และ CSS ที่ไร้สาระทั้งหมดคือการใช้แฟล็ก -D เพื่อดาวน์โหลดส่วนหัวลงในไฟล์แยกต่างหาก จากนั้นเปิดไฟล์นั้นในโปรแกรมแก้ไขข้อความที่คุณต้องการ :

curl -iD httpheader.txt www.apple.com && เปิด httpheader.txt

นี่คือคำสั่ง curl เหมือนเดิม โดยมีตัวปรับแต่งเล็กน้อย การใช้เครื่องหมายอัฒจันทร์คู่จะบอกคำสั่งให้เปิดไฟล์เฉพาะเมื่อดาวน์โหลดส่วนหัวสำเร็จการใช้ 'open' จะเปิด httpheader.txt ในโปรแกรมแก้ไขข้อความ GUI เริ่มต้น ซึ่งโดยทั่วไปคือการแก้ไขข้อความ แต่คุณสามารถใช้ vi, nano หรือเครื่องมือบรรทัดคำสั่งใดก็ได้ที่คุณต้องการ:

curl -iD httpheader.txt www.apple.com && vi httpheader.txt

curl เป็นยูทิลิตี้ทรงพลังที่ควรค่าแก่การทำความรู้จัก ทุกคนที่เกี่ยวข้องกับเว็บควรใช้ประโยชน์จากเคล็ดลับส่วนหัว และนักพัฒนาเว็บยังสามารถใช้ curl เพื่อคัดลอก HTML และ CSS ทั้งหมดจากเว็บไซต์ได้อย่างรวดเร็ว ข้อดีอีกอย่างของการ curl คือมันใช้งานได้อย่างกว้างขวางสำหรับแทบทุกระบบปฏิบัติการที่มีอยู่ มันมาพร้อมกับ Mac OS X และ Linux เกือบทุกรุ่น และคุณยังสามารถค้นหาเวอร์ชันสำหรับ Windows หรือแม้แต่ Android และ iOS ผ่านแอพเฉพาะบุคคล เนื่องจาก curl มีประวัติอันยาวนานและคำสั่งเป็นสากลในทุกแพลตฟอร์ม จึงเป็นตัวเลือกที่เหมาะสำหรับการดึงรายละเอียดส่วนหัว และเป็นเครื่องมือที่มีค่าสำหรับการดูแลระบบ ผู้ดูแลระบบเครือข่าย นักพัฒนาเว็บ และผู้เชี่ยวชาญด้านเทคนิคอื่นๆ อีกมากมาย

Update: อัปเดตแฟล็กจาก -i เป็น -I ตามคำแนะนำของผู้อ่าน ขอบคุณทุกคน!

รับข้อมูลส่วนหัว HTTP จากเว็บไซต์โดยใช้ curl