Data?, Data!, Data...

  • Open for who?

    • 'Open Data'를 공개하는 분들에게 좋은 가이드라인이 될만한 기사
    • 특히 'Open Data'에 대한 가이드 라인 중에서 'Can a non-programmer access the data?' 부분은 많은 시사점을 던져줌
    • it occurred to me over and over again that we’re not all talking about the same thing when we say ‘open data’. Indeed there seemed to be a kind of fractal misunderstanding about what the word ‘open’ means, or more specifically who the ‘open’ is for.
    • I think it should be a minimum goal for every data project that wants to legitimately use the term open to score at least a 3 on this test
    • Finally, to make a data project truly open to anyone, we need to think about outreach, past the computer. There is a technocentricity to our platforms that is difficult to overcome: how do we make our data open to those with low levels (or no levels) of digital literacy?
  • Data Mining Hacker News: Front vs Back

    • 해커뉴스의 첫 페이지를 분석하는 기사, 해당 뉴스 페이지를 분석함에 있어서 'Front'와 'Back'이라는 두 가지 개념을 가지고 SVM 기법으로 데이터를 분석
    • 전체 소스코드를 제공하기 때문에 해당 기사에서 분석 방법으로 사용한 SVM을 연습하기에 좋음!
  • The Data of the Chicago Marathon

    • 2005~2016년까지 진행된 시카고 마라톤에서 발생된 데이터를 분석한 기사
    • 아주 단순화된 그래프를 가지고 데이터 분석 결과를 설명하고 있는 것 같지만, 그래프의 종류가 매우 다양하기 때문에 데이터분석과 시각화에 관심이 있는 분들에게 추천!

Python with PY Family