컴퓨터과학과

컴퓨터과학과 학생 게시판

조회 수 330 추천 수 1 댓글 4

단축키

Prev이전 문서

Next다음 문서

빅데이터 3Vs
- Volume : 데이터의 양 ↑
- Variety : 데이터의 종류 (다양한 형태의 데이터) ↑
- Velocity : 데이터 발생 속도 ↑

 

Small Data Tool

-R

-Matlab

-Pandas (with Python)

-Numpy (with Python)

-Scikit-learn (with Python)

등등

 

Big Data System

=> Hardware Distributed Storage -> Distributed Processing -> Application ( 4단계로 구성)

 

Hardware : 빅데이터를 다루고 분석하기 위한 수많은 컴퓨터들로 구성

Distributed Storage : 많은 컴퓨터들의 데이터를 저장하고 관리하는 분산 스토리지 시스템

Distributed Processing : 저장 및 관리되는 데이터를 빠르게 분석하기 위한 분산 프로세싱 시스템

Application : 분산 처리를 가능하게 해주는 시스템

 

기능

많은 머신에서 데이터를 쪼개고 분배해주는 것을 자동으로 수행

분석 Job을 작은 단위의 task로 나누어 빠르게 수행하는 것을 자동으로 수행

장애가 발생했을 때 자동 복구

 

Data Analysis Categories

Batch processing : 데이터를 큰 단위로 분석

Interactive query : 데이터를 상호 질의를 통해 분석

Stream Processing : 실시간으로 분석하여 결과를 도출

Graph Processing : 그래프 데이터에 특화된 처리

Machine Learning / Deep learning : 예측 모델을 만듦

 

 

데이터 분석 시스템 및 머신러닝 대표 시스템

#2015년부터 머신러닝, 딥러닝 소프트웨어

 

 

Apache

- Hadoop(2006)

- YARN, HDFS, Hadoop MR로 구성

- HDFS : 빅데이터 분석 애플리케이션에 최적화, 데이터 복제(장애 복구)

- Hadoop MR(Map Reduce) : MapReduce라는 함수로 데이터 분석을 표현

표현된 데이터 분석은 수행 시 많은 데이터를 잘 처리할 수 있는 scalability를 보여줌

분석 Job이 수행 중 어떤 task에 장애가 발생했을 경우, 해당 task를 다시 시작(장애 복구)

=> 빅데이터 초기부터 운영되었으며, 빅데이터 시스템에 상당히 큰 영향을 줌

 

 

 

- Spark(2014, In-Memory Computing)

-더 다양한 분석 프로그램을 쉽게 표현할 수 있었다.

 -> 제한된 형태로 분석 프로그램을 표현할 수 밖에 없던 하둡에 비하여 일반적인 그래프 형태로 쉽게 표현 가능

- 메모리를 사용하여 분석 속도를 빠르게 함

 -> 분석한 중간 결과를 중간에 메모리에 저장하고 뒷부분에서 계산하는 부분에 해당하는 중간 결과를 읽어서 계산

 

쉬운 프로그래밍 인터페이스

 -> 복잡한 데이터 분석 파이프라인을 다양한 변환을 통하여 쉽게 데이터 분석 파이프라인을 표현 가능함

 

Google TensorFlow(2015)

오픈 머신러닝 프레임워크 (머신러닝에도 가능하지만 딥러닝에도 인기가 많음)

수학적인 계산으로 머신러닝 모델을 표현해서 수행하는 것들이 가능함

그렇게 표현한 것들을 내부적으로 Data Flow Graph라는 형태로 변환하여 수행

 

 

딥러닝 프레임워크

TensorFlow

Pytorch

Caffe2

MXNET

등등

 

분산 스토리지

데이터를 여러 머신에 읽고 쓸 수 있는 프로그램

분산 파일 시스템

하둡의 분산 파일 시스템

- 빅데이터에 최적화 (큰 데이터를 한 번에 쭉 읽음)

- 데이터를 맨 뒤에 붙이는 append 방식에 쓰는데 최적화

- 데이터 자체가 크기 때문에 하나의 데이터 유닛으로 큰 블록 사이즈 사용 (128MB, 256MB )

- 데이터를 안정적으로 보존하기 위해 장애 복구 지원 (HDFS) #Master-Worker architecture

  • ?
    hyor 2021.11.03 19:46
    비회원은 댓글은 읽을 수 없습니다.
    로그인 후에 바로 열람 가능합니다 ^^
  • ?
    쿠스코프 2021.11.07 12:12
    비회원은 댓글은 읽을 수 없습니다.
    로그인 후에 바로 열람 가능합니다 ^^
  • ?
    puris 2022.01.13 11:44
    비회원은 댓글은 읽을 수 없습니다.
    로그인 후에 바로 열람 가능합니다 ^^
  • ?
    knowyou김 2024.03.01 18:13
    비회원은 댓글은 읽을 수 없습니다.
    로그인 후에 바로 열람 가능합니다 ^^

컴퓨터과학과

컴퓨터과학과 학생 게시판

List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 (필독) 공지 모음 / 방송대 커뮤니티 포인트 얻는 방법 및 입문서 416 게시판관리 9613 2022.12.24
공지 방송통신대학교 커뮤니티 홍보하고 포인트 적립하자! 73 게시판관리 4381 2023.09.20
공지 🎖 활동 메달 안내 및 기준 37 게시판관리 1447 2025.07.30
공지 📢 자료 업로드 규정 안내 (AI 사용 여부·출처 표기 의무화) 과거자료 재동록자 적발 시 IP차단 12 게시판관리 811 2025.11.14
1076 일반 방통대 메일과 오피스등 지원문제 1 new 예린지 14 2026.01.28
1075 과공지 2025 데이터분석 경진대회 예비심사 결과 발표 안내 new noir 13 2026.01.28
1074 일반 대학생이 되면 발생하는 특전이 있습니다. 3 updatefile 예린지 49 2026.01.28
1073 일반 방송대_컴퓨터과학과_2026_개설과목 엑셀파일입니다. file 예린지 25 2026.01.28
1072 질문 직장인 3학년 편입생 입니다.(졸업 학점 이수 관련) 2 홍이장군 26 2026.01.28
1071 질문 대체로 변경 3 쌉뚱보 58 2026.01.27
1070 과공지 2026 컴퓨터과학과 개설교과목 안내(개편사항 반영_260126) file noir 59 2026.01.27
1069 질문 회사 재직중 3학년 편입 도전!! 19학점 수강신청 어떨까요? 3 updatefile Luckyzzz 83 2026.01.26
1068 일반 3학년 편입 수강 과목 추천 file 김홍도 53 2026.01.26
1067 일반 슨배님들 3학년 컴과 편입생 수강계획 평가 부탁드려요..!! 1 file 야루루루롤 64 2026.01.25
1066 질문 직장다니는 이번 편입 3학년인데 과목이렇게 괜찮을까요? file 코드워프 58 2026.01.25
1065 질문 3학년 1학기 편입생입니다. 수강신청 조언을 부탁드리고 싶습니다. 1 file jayy 85 2026.01.24
1064 일반 선배님들 수강신청 조언부탁드립니다~ 1 file 배삐삐 63 2026.01.24
1063 일반 3학년 컴퓨터과학과 노베이스 편입생 수강신청에 조언 부탁드립니다. 3 file angelglow 145 2026.01.23
1062 질문 1학년 입학 예정입니다. 수강신청 도움 부탁 드립니다. 2 나리킨 79 2026.01.23
1061 일반 3학년 편입생 과목평가 부탁드립니다. Cohpe 68 2026.01.22
1060 일반 편입생 과목 추천 부탁드립니다. 5 update 세잎네잎 138 2026.01.22
1059 일반 3학년 편입생 수강신청 질문입니다 2 복숭아타르트 124 2026.01.22
1058 일반 [1월 24일] 장애인/노약자/차상위계층 외 일상생활 처우개선 프로젝트 모임 file Gotithelab 47 2026.01.21
1057 질문 입학식 관련 질문입니다. 2 kalsuend 95 2026.01.20
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 54 Next
/ 54