πŸ”Ž Как ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с сайта python: простыС способы ΠΈ совСты

Как ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с сайта с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python?

Для спарса ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ с Π²Π΅Π±-сайта Π²Π°ΠΌ потрСбуСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ requests для Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ страницы ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ BeautifulSoup для Ρ€Π°Π·Π±ΠΎΡ€Π° HTML-ΠΊΠΎΠ΄Π° ΠΈ поиска Π½ΡƒΠΆΠ½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ. Π’ΠΎΡ‚ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π°:


import requests
from bs4 import BeautifulSoup
import urllib

# URL Π²Π΅Π±-страницы, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ находится ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ°
url = 'https://www.example.com/page'

# Π—Π°Π³Ρ€ΡƒΠΆΠ°Π΅ΠΌ страницу
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# Находим Ρ‚Π΅Π³  с Π½ΡƒΠΆΠ½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΎΠΉ
image_tag = soup.find('img', src=True)

# ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ссылку Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ
image_url = urllib.parse.urljoin(url, image_tag['src'])

# Π‘ΠΊΠ°Ρ‡ΠΈΠ²Π°Π΅ΠΌ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π½Π° Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ диск
response = requests.get(image_url)
with open('image.jpg', 'wb') as f:
    f.write(response.content)

Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ ΠΊΠΎΠ΄Π΅ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ requests для Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ страницы, Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ BeautifulSoup для Ρ€Π°Π·Π±ΠΎΡ€Π° HTML-ΠΊΠΎΠ΄Π° ΠΈ поиска Ρ‚Π΅Π³Π° с Π½ΡƒΠΆΠ½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΎΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ urllib для получСния ΠΏΠΎΠ»Π½ΠΎΠΉ ссылки Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ. Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ requests снова для Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ ΠΈ сохранСния Π΅Π΅ Π½Π° Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ диск.

Π£Π±Π΅Π΄ΠΈΡ‚Π΅ΡΡŒ, Ρ‡Ρ‚ΠΎ Ρƒ вас установлСны Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ requests ΠΈ BeautifulSoup ΠΏΠ΅Ρ€Π΅Π΄ запуском ΠΊΠΎΠ΄Π°:


pip install requests
pip install beautifulsoup4

НадСюсь, этот ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Π²Π°ΠΌ ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с Π²Π΅Π±-сайта с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python!

Π”Π΅Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚

Как ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с сайта с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python?

ΠŸΠ°Ρ€ΡΠΈΠ½Π³ Π²Π΅Π±-страниц ΠΈ ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π½ΡƒΠΆΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ β€” это Π²Π°ΠΆΠ½Ρ‹Π΅ Π½Π°Π²Ρ‹ΠΊΠΈ для программиста. Если Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с Π²Π΅Π±-сайта с использованиСм Python, Π²Π°ΠΌ потрСбуСтся Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с HTTP-запросами ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ HTML-ΠΊΠΎΠ΄Π°.

Установка Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊ

ΠŸΠ΅Ρ€Π΅Π΄ Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ Π½Π°Ρ‡Π°Ρ‚ΡŒ ΡΠΏΠ°Ρ€ΡΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ, ΡƒΠ±Π΅Π΄ΠΈΡ‚Π΅ΡΡŒ, Ρ‡Ρ‚ΠΎ Ρƒ вас установлСны ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ:


pip install requests
pip install beautifulsoup4

Π¨Π°Π³ΠΈ ΠΏΠΎ ΡΠΏΠ°Ρ€ΡΠΈΠ²Π°Π½ΠΈΡŽ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ

  1. Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ:
  2. 
    import requests
    from bs4 import BeautifulSoup
    
  3. ΠžΡ‚ΠΏΡ€Π°Π²ΡŒΡ‚Π΅ HTTP-запрос Π½Π° Π²Π΅Π±-сайт ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ HTML-страницу:
  4. 
    url = "URL_сайта"
    response = requests.get(url)
    
  5. Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ BeautifulSoup для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ HTML-ΠΊΠΎΠ΄Π°:
  6. 
    soup = BeautifulSoup(response.content, "html.parser")
    
  7. НайдитС Ρ‚Π΅Π³, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ содСрТится нуТная Π²Π°ΠΌ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ°:
  8. 
    image_tag = soup.find("img", {"class": "названиС_класса"})
    
  9. Π˜Π·Π²Π»Π΅ΠΊΠΈΡ‚Π΅ URL ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ ΠΈ сохранитС Π΅Π΅:
  10. 
    image_url = image_tag["src"]
    response = requests.get(image_url)
    with open("имя_Ρ„Π°ΠΉΠ»Π°.jpg", "wb") as file:
        file.write(response.content)
    

Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ выполнСния этих шагов Π²Ρ‹ смоТСтС ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с Π²Π΅Π±-сайта ΠΈ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π΅Π΅ Π½Π° своСм ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅. ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ Π²Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π·Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ "URL_сайта", "Π½Π°Π·Π²Π°Π½ΠΈΠ΅_класса" ΠΈ "имя_Ρ„Π°ΠΉΠ»Π°.jpg" Π½Π° ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ значСния Π² соотвСтствии с вашими потрСбностями.

Π’ΠΈΠ΄Π΅ΠΎ ΠΏΠΎ Ρ‚Π΅ΠΌΠ΅

ΠŸΠ°Ρ€ΡΠΈΠ½Π³ сайтов PYTHON - #4 Π‘ΠšΠΠ§Π˜Π’ΠΠΠ˜Π― Π€ΠΠ™Π›ΠžΠ’, ΠŸΠΠ Π‘Π˜ΠΠ“ ДАННЫΠ₯

ΠŸΠ°Ρ€ΡΠ΅Ρ€ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ с сайта Π½Π° Python

ΠŸΠ°Ρ€ΡΠΈΠ½Π³ Π² Python Π·Π° 10 ΠΌΠΈΠ½ΡƒΡ‚!

ΠŸΠΎΡ…ΠΎΠΆΠΈΠ΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ:

🐍 ΠŸΠΈΡ‚ΠΎΠ½ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ: Как ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅?

πŸ”§ Как Π·Π°ΠΌΠ΅Π½ΠΈΡ‚ΡŒ строку Π² Python: простоС руководство ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΊΠΎΠ΄Π°

πŸ”Ž Как ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ Π½Π° ΠΏΠΈΡ‚ΠΎΠ½Π΅: простой руководство для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…

πŸ”Ž Как ΡΠΏΠ°Ρ€ΡΠΈΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ с сайта python: простыС способы ΠΈ совСты

Как пСрСвСсти Π΄Π°Ρ‚Ρƒ Π² сСкунды с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python? πŸπŸ“…

πŸ•°οΈ Как пСрСвСсти часы Π² ΠΌΠΈΠ½ΡƒΡ‚Ρ‹ Π² Python | ΠŸΡ€ΠΎΡΡ‚ΠΎΠΉ способ

Как ΡΠΎΠΊΡ€Π°Ρ‚ΠΈΡ‚ΡŒ условиС if Π² Python? 5 ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… совСтов πŸ‘¨β€πŸ’»