본문 바로가기

실버를 위한 코딩104

단어문서 행렬(Term-Document Matrix, TDM) 단어문서 행렬(Term-Document Matrix, TDM)단어문서 행렬(Term-Document Matrix, TDM)은 텍스트 마이닝과 자연어 처리(NLP)에서 자주 사용되는 도구입니다. TDM은 문서 집합에서 단어의 빈도를 분석하는 데 사용됩니다. 이를 통해 문서 간의 유사성을 측정하거나 특정 주제에 대한 중요 단어를 식별할 수 있습니다.단어문서 행렬의 구성TDM은 행과 열로 구성된 2차원 행렬입니다:행(Row): 각 행은 개별 단어(또는 용어)를 나타냅니다.열(Column): 각 열은 개별 문서를 나타냅니다.값(Value): 특정 문서에서 특정 단어의 발생 빈도(count)를 나타냅니다.예시다음은 간단한 예시입니다:문서 집합:"I love data science""Data science is f.. 2024. 6. 22.
주피터 노트북, 코랩과 아나콘다 사용상의 차이 주피터 노트북, 코랩과 아나콘다 사용상의 차이주피터 노트북을 구글 코랩과 아나콘다에서 사용하는 경우는 각기 장단점이 있습니다. 이를 비교하여 설명드리겠습니다.1. 접근성 및 설치구글 코랩 (Google Colab)접근성: 웹 브라우저만 있으면 언제 어디서나 접근할 수 있습니다.설치: 별도의 설치 과정이 필요 없습니다. 구글 계정만 있으면 됩니다.업데이트: 항상 최신 버전의 주피터 노트북을 사용할 수 있습니다. 아나콘다 (Anaconda)접근성: 로컬 컴퓨터에 설치하여 사용합니다.설치: 아나콘다 배포판을 설치해야 합니다. 초기 설치와 환경 설정이 다소 번거로울 수 있습니다.업데이트: 수동으로 업데이트를 해야 하며, 설치된 패키지의 호환성을 고려해야 합니다.2. 하드웨어 자원구글 코랩 (Google Cola.. 2024. 6. 21.
Jupyter Notebook 사용법 아나콘다(Anaconda)는 데이터 과학과 머신러닝 작업을 위한 종합적인 파이썬 및 R 배포판입니다. 수많은 데이터 과학 패키지와 라이브러리가 포함되어 있어 설치가 간편합니다. Anaconda Navigator를 통해 손쉽게 Jupyter Notebook, Spyder 등의 IDE를 실행할 수 있습니다. Jupyter Notebook은 데이터 과학, 교육, 연구 등 다양한 분야에서 널리 사용되는 인터랙티브 환경입니다.1. Jupyter Notebook 사용법Jupyter Notebook을 실행하면 브라우저에서 대시보드가 열립니다. 대시보드 사용법을 설명드리겠습니다.노트북 파일 열기 및 생성:기존의 노트북 파일을 열려면 파일 이름을 클릭합니다.새로운 노트북을 생성하려면 우측 상단의 "New" 버튼을 클릭한.. 2024. 6. 20.
아나콘다로 주피터 노트북을 사용하는 방법 아나콘다로 주피터 노트북 활용아나콘다로 Jupyter Notebook을 설치하고 사용하는 방법을 단계별로 설명드립니다.1. 아나콘다 설치먼저, Anaconda를 설치해야 합니다. Anaconda는 Python과 데이터 과학에 필요한 다양한 패키지를 포함하고 있는 배포판입니다.Anaconda 공식 사이트로 이동합니다."Download" 버튼을 클릭하여 운영 체제에 맞는 설치 파일을 다운로드합니다.다운로드한 설치 파일을 실행하고 안내에 따라 설치를 진행합니다. 2. Jupyter Notebook 실행Anaconda를 설치하면 Jupyter Notebook도 함께 설치됩니다. Jupyter Notebook을 실행하는 방법은 다음과 같습니다.Anaconda Navigator 사용:Anaconda Navigato.. 2024. 6. 19.
'R' 개발과 성장의 역사 R 개발의 역사R은 데이터 분석과 통계 계산을 위해 설계된 프로그래밍 언어이자 소프트웨어 환경입니다. R의 개발 역사는 통계학과 컴퓨터 과학의 발전과 함께하며, 아래와 같은 주요 단계를 거쳐 왔습니다.1. 초기 개발 (1990년대 초반)기원: R은 뉴질랜드 오클랜드 대학교의 로스 이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)이 1992년에 개발을 시작했습니다. 이들은 통계 분석 소프트웨어 S의 영향을 받아 더 자유롭고 유연한 소프트웨어를 만들기 위해 R을 개발했습니다.목표: 이 프로젝트의 목표는 학술 연구와 교육에 적합한 데이터 분석 도구를 만드는 것이었습니다.2. 공개 및 초기 발전 (1995-2000년대 초반)초기 공개: 1995년에 R은 GNU GPL(General P.. 2024. 6. 15.
Windows에서 'R'과 'RStudio' 설치 Windows에서 'R'과 'RStudio' 설치 과정Windows 운영체제에서 'R'과 'RStudio'를 설치하는 방법을 단계별로 설명드리겠습니다. 이 과정을 따르면 손쉽게 데이터 분석 환경을 구축할 수 있습니다.1. R 설치하기CRAN 웹사이트 접속:웹 브라우저를 열고 CRAN R 다운로드 페이지에 접속합니다. 'CRAN'은 'Comprehensive R Archive Network'의 약자로, R 프로젝트의 공식 패키지 저장소입니다. CRAN은 R의 설치 파일, 패키지, 문서 등을 제공하여 R 사용자들이 쉽게 설치하고 업데이트할 수 있도록 지원합니다. 전 세계에 분산된 여러 서버를 통해 접근할 수 있으며, 패키지 검증 시스템을 통해 품질을 유지합니다. CRAN은 R 생태계의 핵심 인프라로, 데이터.. 2024. 6. 14.