Cara Mengekstrak Tautan dari Halaman Web Apa Pun Menggunakan PowerShell
PowerShell 3 memiliki banyak fitur baru, termasuk beberapa fitur terkait web baru yang kuat. Mereka secara dramatis menyederhanakan otomatisasi web, dan hari ini kami akan menunjukkan kepada Anda bagaimana Anda dapat mengekstraksi setiap tautan tunggal dari halaman web, dan secara opsional mengunduh sumber daya jika Anda menginginkannya..
Mengikis Web Dengan PowerShell
Ada dua cmdlet baru yang membuat mengotomatiskan web lebih mudah, Invoke-WebRequest yang membuat penguraian konten yang dapat dibaca manusia lebih mudah, dan Invoke-RestMethod yang membuat konten yang dapat dibaca mesin lebih mudah dibaca. Karena tautan adalah bagian dari HTML suatu halaman, tautan adalah bagian dari barang yang dapat dibaca manusia. Yang harus Anda lakukan untuk mendapatkan halaman web adalah menggunakan Invoke-WebRequest dan berikan URL.
Invoke-WebRequest -Uri 'http://howtogeek.com'
Jika Anda menggulir ke bawah Anda akan melihat respons memiliki properti tautan, kami dapat menggunakan fitur enumerasi anggota baru PowerShell 3 untuk memfilternya..
(Invoke-WebRequest -Uri 'http://howtogeek.com') .Links
Seperti yang Anda lihat Anda mendapatkan banyak tautan kembali, ini adalah di mana Anda perlu menggunakan imajinasi Anda untuk menemukan sesuatu yang unik untuk menyaring tautan yang Anda cari. Mari kita anggap kita ingin daftar semua artikel di halaman depan.
((Invoke-WebRequest -Uri 'http://howtogeek.com') .Links | Where-Object $ _. Href-like “http *” | Di mana class -eq “title”). Judul
Hal hebat lain yang dapat Anda lakukan dengan cmdlet baru adalah mengotomatiskan unduhan sehari-hari. Mari kita lihat secara otomatis menghapus gambar hari ini dari situs web Nat Geo, untuk melakukan ini kita akan menggabungkan cmdlet web baru dengan Start-BitsTransfer.
$ IOTD = ((Invoke-WebRequest -Uri 'http://photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Di mana innerHTML seperti "* Unduh Wallpaper *"). Href
Start-BitsTransfer -Sumber $ IOTD -Tujuan C: \ IOTD \
Itu semua yang ada untuk itu. Punya trik Anda sendiri yang rapi? Beri tahu kami di komentar.