본문 바로가기
내일배움캠프(Sparta)/웹개발 A to Z

[웹개발 A to Z] 5주차 (배포, 깃허브)

by mmm- 2023. 9. 8.

1. 배포

배포

: 소프트웨어 개발 과정에서 개발한 애플리케이션, 웹사이트, 서비스 등을 실제 사용자들에게 제공하는 과정

 

  • 코드 작성부터 테스트, 실행 파일로 변환하여 인터넷에 공개하고 업데이트하는 과정으로, 배포가 이루어지게 되면 다른 사람들이 프로그램을 사용할 수 있다.

 

URL

: Uniform Resource Locator의 약자. 인터넷에서 특정 리소스의 위치를 나타내는 고유한 주소

프로토콜://도메인/경로

→ 일반적인 도메인의 형식

 

URL을 사용해 웹 페이지에 접속할 수 있을 뿐만 아니라 파일을 다운로드하거나 웹 사이트 간에 정보 전달을 할 수도 있습니다.

 

프로토콜(protocol)

: 웹 브라우저와 웹 서버 간의 통신 방식을 지정. 가장 일반적으로 사용되는 프로토콜은 "http://", "https://"

 

도메인(domain)

: 인터넷 상에서 고유한 식별자로 사용되는 웹 사이트의 주소. 도메인은 일반적으로 사이트의 이름과 최상위 도메인(ex;m .com, .org)으로 구성됨.

 

경로(path)

: 웹 사이트 내에서 특정 페이지나 파일의 위치를 지정. 경로는 "/"로 구분된 디렉토리 경로와 파일명으로 구성됨.

 


2. 깃허브

깃허브(Github)

: 인터넷에서 개발자들이 자신의 코드를 저장하고 다른 사람들과 공유하는 곳

 

주요 기능

  1. 코드 관리 : 코드 버전 관리
  2. 협업 : 여러 개발자가 한 프로젝트에 참여 가능
  3. 웹 호스팅 : 인터넷에 공개적으로 호스팅하여 다른 사람들이 쉽게 접근하고 이용 가능
  4. 지식 공유 : 다른 개발자들과 코드, 프로젝트, 라이브러리 등 공유 가능

3. 파이어베이스의 한계점

  1. 서버 제어 제한 : 서버 인프라에 대한 직접적인 컨트롤이 제한되어 파이어베이스에서 제공하는 기능과 방식에 따라 작업 수행
  2. 확장성 제약 : 규모에 따른 가로 확장성 측면에서 제한이 있을 수 있음
  3. 종속성 : 구글 서비스에 의존하게 되어 파이어베이스 외부의 다른 서비스나 기능을 활용하기 어렵거나 제한적일 수 있음

4. 스크래핑

Colab

: 구글에서 제공하는 클라우드 기반 무료 Python 실행 환경으로, 파이썬으로 데이터 분석을 할 때 연구자들이 많이 사용

 

사용 방법

1. https://colab.research.google.com/?hl=ko 에 접속 후 우측 상단의 로그인 버튼 클릭

2. 구글에 로그인

3. 로그인 후, 메인 화면 좌측 상단의 "파일" → "새 노트" 클릭

 

import requests
from bs4 import BeautifulSoup

URL = "https://movie.daum.net/ranking/reservation"
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')

→ 크롤링을 위한 기본 setting 코드

 

스크랩핑

: 웹 페이지의 특정 부분에서 필요한 정보를 추출하는 작업

 

스크랩핑 원리

: 인터넷에서 필요한 정보를 가져오기 위해 웹 페이지의 구조와 내용을 읽어오는 것.

 

Daum영화에서 스크랩핑