R, Python 및 Hadoop을 배우는 21 가지 이유 (위의 원문을 번역 정리한 내용임)
당신이 빅 데이터 전문가, 데이터 과학자를 꿈꾸면 R, Python, Hadoop 알아야 한다.
WHY R?
- 데이터 과학자는 코딩 능력, 통계학 전공 지식이 필요하며 통계학자가 통계 프로그래밍 언어 중 표준인 R을 쉽게 배울 수 있다.
- R은 오픈 소스이며 무료로 사용할 수 있다. SAS, Matlab과 달리 자유롭게 R을 설치, 사용, 업데이트, 복제, 수정, 재배포 및 재판매 할 수 있고 통계 프로그래밍 언어에 유용한 쉬운 업그레이드도 가능하다.
- R은 플랫폼 간 호환이 가능합니다. R은 Windows, Mac OS X 및 Linux에서 실행할 수 있다. 또한 Microsoft Excel, Microsoft Access, MySQL, SQLite, Oracle 및 기타 프로그램에서 데이터를 가져올 수 있다.
- R은 강력한 스크립(프로그래밍)팅 언어로 크고 복잡한 데이터 세트를 처리 할 수 있으며, 대용량, 자원 집약적 시뮬레이션이 가능하고 고성능 컴퓨터 클러스터로 사용할 수 있습니다.
- R은 사용자가 급속히 증가하고 매우 유연하고 발전했다. 새로운 통계 방법론의 함수, 패키지가 빠르게 업로드 된다.
- R은 분석 결과(그래프 포함)를 워드 프로세싱 문서에 삽입 가능하다. 연구 논문의 그래프도 R 이 출판 가능 수준의 품질을 제공한다.
- R은 정기적으로 토론 포럼, 온라인 글로벌 커뮤니티 - 거대하고 활발한 커뮤니티 및 리소스 뱅크 를 보유하고 있다. 현재 2,000 개의 통계분석을 위한 무료 라이브러리가 제공되고 있다.
WHY Python?
R보다 배우기 쉽고 웹 및 게임 개발자들 사이에서 선호되는 고급 프로그래밍 언어이다.
- Python은 배우기 쉽다. Python 프로그램은 코드 가독성 높고, 간단한 구문 및 구현 용이성, 사용자 친화적이다.
- Python은 짧은 코드로 디버그하기 쉽다.
- Python은 널리 사용되고 있다. Python은 Google의 검색 엔진, YouTube, DropBox, Reddit, Quora, Disqus 및 FriendFeed를 지원한다.
- Python도 R과 같은 객체 지향 언어입니다. Python 기초를 이해하면 새로운 언어의 구문을 배우기 만하면되므로 다른 객체 지향 언어로 마이그레이션이 가능하다.
- Python은 오픈 소스이고 단순성은 매력적이다.
- Python은 고성능 언어로 비즈니스에 필수적인 고속 응용 프로그램을 구축하기 위한 언어로 오랫동안 사용되고 있다.
- Python은 Rasberry Pi(영국 개발 초소형 PC)에서 사용가능하다.
WHY Hadoop?
- Hadoop은 R 및 Python과 마찬가지로 오픈 소스이다.
- Hadoop은 방대한 양의 데이터를 쉽게 저장하고 처리 할 수 있어 고객의 시대에 필요한 유연한 미래의 데이터 플랫폼의 초석으로 강력하다.
- Hadoop은 다양한 기능을 제공 : 데이터웨어 하우징, 예측 분석, 데이터 검색 및 ETL(추출-변환-부하)에도 사용된다.
- Hadoop은 다양한 역할 : Hadoop Architects, Hadoop 개발자, 데이터 과학자 또는 관리자로 일할 수 있다.
- Hadoop은 Big Data 시장에서 가장 많이 찾는 기술 중 하나이며, 인증 된 Hadoop 개발자의 연봉은 매우 높다.
- 하둡은 미래 지향적 도구, 건강한 미래를 가지고 있다.
- Hadoop 사용은 다국적 기업에서 증가 : 델, 아마존 웹 서비스, IBM, 야후, 마이크로 소프트, 구글, 이베이, 오라클과 같은 상위 기업들은 Hadoop 언어에 의존하고 있다.