기본 콘텐츠로 건너뛰기

1월, 2013의 게시물 표시

Azure Big Data 시리즈 2 – Hadoop Task 실행과 Excel Add-In 을 사용한 분석 결과 처리

출처 : http://www.windowsazure.com/en-us/develop/net/tutorials/hadoop-marketplace/ 이 샘플은 Windows Azure 상에서 2 가지 방법으로 Apache Hadoop 기반의 클러스터에서 MapReduce 프로그램을 어떻게 수행하는지를 알아보고, 클러스터에 수집된 데이터를 Excel 에서 분석하는 방법에 대해서 알아보는 것이다. 실제 데이터 분석을 처리하는 것은 자바로 구현된 MapReduce 프로그램이며, 이 프로그램을 수행하는 방법은 아래와 같이 두 가지 방법을 사용할 수 있다. Hadoop jar 파일 – “Create Job UI” 에서 jar 파일을 이용해서 수행한다. Pig 에서 스크립트 – Pig 에서 제공되는 Fluent API 를 이용하는 자바스크립트를 이용해서 수행한다. 샘플에서 사용할 데이터는 Azure Marketplace 를 통해서 데이터, 이미지, 주요 상업 데이터 제공자들로부터 실 시간 웹 서비스 및 신뢰할 수 있는 공공 데이터들을 수집하게 된다. 이렇게 수집된 데이터는 인구 통계학적, 환경, 금융, 소매, 스포츠 데이터를 포함한 데이터들의 다양한 구매 및 소비를 단순화하는 것이다. 이렇게 수집된 데이터는 Azure에서 Hadoop 으로 업로드 되고, Excel 을 이용해서 데이터를 분석한 결과를 조회하는 방식이다. MS 에서 제공하는 빅 데이터의 핵심은 BI (Business Intelligence) 의 구성 요소와 Hadoop 의 통합이라고 볼 수 있다. MS BI 와 Hadoop 과의 통합의 가장 좋은 사례는 Hadoop 클러스터의 Data warehouse 프레임워크에 Excel 로 접속이 가능하다는 점이다. 이 샘플에서는 Hive ODBC 드라이버를 통해서 Excel에서 Hadoop 클러스터에 존재하는 데이터에 접근하는 방법에 대해서 알아보도록 한다. 이 샘플을 통해서 확인하고 배울 수 있는 내용은 다음과 같다. Hadoop jar 파일을 이용

Azure Big Data 시리즈 1 – Web Site with MongoDB

출처 : http://www.windowsazure.com/en-us/develop/net/tutorials/website-with-mongodb-vm/ 이 시리즈에서는 Windows Azure 를 사용하는 것과 간단하게 웹 사이트를 구성하고 MongoDB를 활용하는 방법에 대해서 알아보도록 한다.   Windows Azure 설정 이미 Windows Azure 에 계정이 존재하고 운영 중이라면 생략해도 상관 없다. 이 부분은 Azure를 처음 사용하는 방법에 대해서 설명하는 부분이다. http://www.windowsazure.com 에 접속하면 아래와 같은 화면을 볼 수 있다. 오른쪽 상단의 “무료 평가판”을 클릭하여 무료 계정을 90일간 사용해 볼 수 있다. “무료 평가판”을 사용하기 위해서는 MS 라이브 계정이 존재하여야 한다. 이미 존재하는 계정이 있으면 로그인을 하고 다시 Azure 사이트로 이동하여 “무료 평가판” 을 다시 클릭하면 아래와 같은 Azure 청구 계정에 대한 설정 부분을 볼 수 있다. 개인 인증과 결제(신용카드 또는 핸드폰)에 대한 정보를 입력하며 된다. “무료 평가판”에서는 결제 비용이 0원으로 처리된다. 청구 계정에 대한 처리가 완료되면 아래와 같은 화면을 볼 수 있다. 상단의 “미리 보기 기능” 을 클릭한다. “미리 보기 기능” 화면은 크게 “모바일 서비스” 와 “VM 및 VM 네트워크” 메뉴를 볼 수 있다. 우선은 아래 쪽의 “MANAGE” 를 클릭하여 다음으로 진행한다. 아래의 화면과 같이 왼쪽의 메뉴들 중에서 “WEB SITES”를 선택하고, “CREATE A WEB SITE”를 클릭한다. 아래의 화면과 같이 웹 사이트의 URL 과 지역을 입력하고 “CREATE WEB SITE”를 클릭하면 웹 사이트틀 생성하게 된다. 당연히 샘플을 위한 웹 사이트 이므로 임의대로 URL을 입력하면 된다. 웹 사이트 생성과정이 완료되면 아래의 화면과 같이 1개의 웹 사이트가 운영 중이라는 것을 확