본문 바로가기

COMPUTING/BIG DATA

인사 & 혼공 R데이터분석 1주차 공부 인증

인사말

안녕하세요! 오재용입니다. 저번 달 6월 20일에 방학한 게 엊그제 같은데 벌써 종강한 지 2주나 지났네요. 시간이 너무나 빠르게 지나가는 것 같습니다.
저는 인천에서 고등학교 친구들을 간간히 만나면서 지내고 있습니다. 평소 집에 있을 때는 영화 보거나 책을 읽는 것 같네요. 이제 책을 읽을 시간이 없어질 예정이라 이번 방학에 질리도록, 닥치는 대로 읽을 생각입니다.

그래서 저번 주 27일부터 30일까지 동기들과 제주도 여행 갔다 올 때에도 책 한 권 들고 읽고 왔습니다. 동기들이 여행에 웬 책이냐며 신기하게 보긴 했지만 아랑곳하지 않고 읽었던 기억이 남네요. ㅎㅎ 뭐든지 계속 경험하려는 태도가 가장 중요한 거니까요!
이번 제주도 여행에 대해 조금 말씀드리자면, 출국 전부터 걱정이 많았어요. 전국적으로 집중호우가 걸려서 제주도도 많은 비가 오기로 되어 있었습니다. 그래서 관광은 고사하고 비행기가 연착 없이 잘 뜰 수 있을까 노심초사했죠. 다행히 떠나는 날에 김포공항엔 비가 안 내려서 지연 없이 무사 도착했습니다. 돌아오는 날 역시 마찬가지고요. 다만 늘 제주도가 흐린 날씨여서 사진 찍긴 그다지 좋진 않았습니다 ㅠㅠ 그나마 괜찮았던 사진 하나 보여드리겠습니다.

점심 먹고 간 랜디스도넛에서 찍은 풍경. 가장 잘 찍은 듯!


이번주부터는 혼공학습단 10기가 시작했죠. 저번에는 3주 차까지 하고, 설연휴로 한 주 쉬고 갔었는데, 이번엔 4주 차까지 하고 한 주 쉬더군요. 조금 호흡이 길어질 것 같긴 한데, 뭐 괜찮습니다. 미리미리 하고 이것저것 건드려보고 있으면 그만이니까요! 첫 주차는 늘 쉬운 과제였으니 후딱 해치우러 가봅시다.
 

CHAPTER 1 빅데이터와 R

드디어 R언어에 대해 배우기 시작합니다. 머신러닝 때와 마찬가지로 첫주차는 사용하는 프로그래밍 언어에 대해 간략한 배경을 배우고, 개발 환경을 다루는 것에서 출발하죠. 이번에 사용할 R언어는 R스튜디오에서 다룰 수 있는데, 재미난 것은 R스튜디오가 프로그램 버전도 있고, 클라우드 버전이 있더라고요. 저번 머신러닝 때는 클라우드 식으로 인터넷 환경아래서 했으니, 이번엔 프로그램을 다운로드하고 활용하도록 할 생각입니다.

 

첫 번째 소단원에서는 빅데이터에 대해 간략히 언급합니다. 요즘 같은 정보화 시대에는 수많은 정보들이 매 순간 쏟아져 나오고, 이것을 잘 저장하고 처리해 유용한 지식을 얻어내려는 기술인 '빅데이터'의 필요성에 대해 말이죠. 이에 대한 대표 주자로 세계적인 검색 엔진 기업인 구글과 야후를 듭니다. 두 기업 모두, 독자적인 시스템으로 정보처리하는 일을 하고 있음을 알 수 있었습니다. 정보처리를 어떻게 해서 원하는 지식을 얻어낼 것이냐는 이제 데이터 분석의 영역이겠죠. 

 

두 번째 소단원에서는 R언어의 특징을 비슷한 언어인 Python과 비교해서 알려줍니다. 이 부분은 표로 설명되어 있긴 한데, 제가 저번에 포스팅했던 자료에도 잘 나와있습니다. 참고 바랍니다.

혼공학습단 10기 들어가기 전에 - 통계학 수업을 회상하며 (tistory.com)
 

 

혼공학습단 10기 들어가기 전에 - 통계학 수업을 회상하며

신청하게 된 배경 안녕하세요? 저번 혼공학습단 9기에 머신러닝과 딥러닝으로 참여하고, 거의 6개월 만에 이렇게 다시 참여를 하게 되었네요! 이번 10기에는 특이하게 R데이터분석으로 신청했습

openaim.tistory.com

장단점은 아래 필기자료에 써두긴 했으나.. 아직 R언어를 써보진 않은 입장에선 굳이 알아도 쓸모는 없는 정보에 해당하는 것 같습니다. R언어에 대해 어느 정도 아는 입장이어서 그런가 대충은 "그렇구나" 하고 넘어갔네요.

 

세 번째 소단원에서 R언어 걸음마를 떼보죠. 처음에 R스튜디오 키면, 정말 아무것도 모르겠는, 영어로 된 4가지 분할 박스가 나오는데, 책에서 이를 간단명료하게 잘 설명해 줍니다. 사실상 제가 써야 할 공간은 script와 console, 그리고 Files가 되지 않을까 싶네요. 이번 주차 미션들은 script 부분에만 잘 코딩하면 되니까 별 어렵지 않았네요! 

 

기본 미션 - Hello World! 출력하기

처음 코딩배울때가 생각나는 미션. 여기서도 문자열을 print함수와 ""로 출력할 수 있다.

선택미션 - p.65의 3번 코드 실행하기

특이하게 R은 블록화 해서 디버깅해줘야 한다. 그리고, 버전마다 출력되는 형식이 다른 듯 하다(console 부분에 dataframe 설명 AERA를 보라!)

 

필기자료

1주차 정리.pdf
1.00MB

 

마무리 및 소감

새로운 형태의 스튜디오를 배우려고 하니, 솔직히 겁이 안 난 건 아니었어요. 그렇지만 혼공책이 친절하게 설명해 주니, 쉽게 대강은 알게 된 기분이네요. 이제 선택미션에서 썼던 데이터프레임 관련 문법에 대해서 차근차근 배우겠죠? 이렇게 정보도 없이 미리 다음 내용을 스포 해버리니, 이상하게 빨리 배우고 싶다는 생각이 드네요 ㅋㅋ

 

다음 2주 차 수요일부터는 동기 3명과 함께 도쿄로 날라가버릴 예정입니다. 그것도 무려 8일동안! 그래서 2주차와 3주차 과제를 미리 끝내놓고 다녀오면 좋지 않을까 싶어요. (그렇지만.. 아마 2주차 하다가 귀찮아지지 않을까 재용아?) 너무 무리하지 않게 남은 시간 동안 잘 쪼개서 미션 수행하고, 다음 주차 포스팅은 이번 1주 차보다 더 빨리 올려볼 수 있게 해 볼게요! 그럼 안녕~

 

출처

혼자 공부하는 R데이터분석 ~p.71