제퍼넷 로고

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

시간

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
이미지 출처 : Freepik
 

데이터를 시각적으로 표현하는 방법에 대한 연구를 데이터 시각화라고 합니다. 데이터를 그래픽으로 플로팅하여 데이터에서 찾은 결과를 효과적으로 전달합니다.

데이터 시각화를 통해 데이터의 시각적 요약을 얻을 수 있습니다. 인간의 마음은 주어진 데이터를 이미지, 지도, 그래프로 제시할 때 더 쉽게 처리하고 이해합니다. 

크고 작은 데이터 세트 모두 데이터 시각화의 이점을 누리지만 대규모 데이터 세트는 모든 데이터를 처리하고 이해하는 것은 고사하고 수동으로 보기가 어렵기 때문에 빛을 발합니다.

데이터 시각화에 대한 연구에는 데이터를 시각적 맥락에 넣어 데이터를 이해하여 다른 방법으로는 볼 수 없는 패턴, 추세 및 연결을 나타내려는 시도가 포함됩니다.

데이터 시각화는 모든 프로그래밍 언어를 사용하여 수행할 수 있지만 Python은 코드 수가 적기 때문에 데이터를 쉽게 시각화하려면 Python을 선택하는 것이 좋습니다.

Python 구문이 쉽고 코딩하는 데 시간이 매우 적게 걸립니다. 또한 Python은 존재하는 기능을 사용하여 데이터 시각화를 위한 다양한 패키지 또는 라이브러리를 제공합니다. 데이터 시각화에 사용되는 일부 Python 라이브러리는 matplotlib 및 seaborn과 데이터 시각화에 사용되는 다른 많은 패키지입니다.

Matplotlib, Seaborn, Bokeh 및 Plotly는 데이터 시각화에 사용되는 Python 라이브러리입니다.

  1. 매트플롯립 산점도, 선 도표, 파이 차트 및 막대 차트와 같은 그래프를 그리는 데 사용되며 이 matplotlib는 데이터 세트의 배열 및 필드와 함께 작동합니다. 
  2. 씨본 채색 및 그래프 디자인과 같은 데이터의 복잡한 시각화에 사용되며 seaborn은 전체 데이터 세트와 함께 작동합니다.
  3. 나뭇잎 사물을 대화식으로 만들어 데이터 시각화에 사용되며 웹 브라우저에서 데이터를 표현하기 위해 HTML 및 javascript를 사용합니다.
  4. 플롯 그래프를 매력적으로 만들고 사용자 지정을 허용하는 데이터 시각화에도 사용됩니다.

이제 이들 각각을 자세히 살펴보겠습니다.

Matplotlib는 산점도, 선 도표, 파이 차트 및 막대 차트와 같은 그래프를 그리는 데 사용되며 이 matplotlib는 데이터 세트의 배열 및 필드와 함께 작동합니다.

Matplotlib는 NumPy를 사용하여 생성된 배열과 함께 작동하는 matplotlib와 같이 사용하기 매우 쉽고 유연성을 제공하는 저수준 인터페이스입니다.

matplotlib를 설치하려면 다음 명령을 사용해야 합니다. 

pip install matplotlib

 

명령 프롬프트에서 이 명령을 실행하면 다음과 같이 표시됩니다.

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
작성자 별 이미지

 

이제 matplotlib를 사용하여 데이터를 시각화할 수 있습니다.

라인 차트

꺾은선형 차트는 데이터 세트의 서로 다른 두 필드를 나타내거나 plot() 함수를 사용하여 두 필드 간의 관계를 표시하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. plot(data['Preg'])
plt. plot(data['age'])
plt. title("Line Plot")
plt. xlabel('Preg')
plt. label('age')
plt. show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

산포도

산점도 데이터를 나타내는 데 점을 사용하는 matplotlib 라이브러리의 scatter() 함수를 사용하여 두 필드 간의 관계를 나타내는 데 사용됩니다.

파이썬에서 다음과 같이 코딩할 수 있습니다.

import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. scatter(data['Preg'], data['age'])
plt. title("Scatter Plot")
plt. xlabel('Preg')
plt. label('age')
plt. show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

바 차트

막대 차트는 데이터를 표현하기 위해 matplotlib 라이브러리의 bar() 함수를 사용하여 범주형 데이터를 표현하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. bar(data['Preg'], data['age'])
plt. title("Bar Plot")
plt. xlabel('Preg')
plt. ylabel('age')
plt.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

히스토그램

히스토그램은 히스토그램의 hist() 함수를 사용하여 그룹 형태로 데이터를 나타내는 데 사용됩니다. 매트플롯립 데이터를 표현하기 위한 라이브러리.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import pandas as pd
import matplotlib.pyplot as plt data = pd.read_csv("diabetes.csv") plt.hist(data['age'])
plt.title("Histogram Plot")
plt.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

Seaborn은 채색, 그래프 디자인 및 Seaborn과 같은 데이터의 복잡한 시각화에 사용되며 전체 데이터 세트와 함께 작동합니다.

Seaborn은 매력적이고 다채로운 출력을 제공하는 높은 수준의 인터페이스를 가지고 있습니다.

seaborn을 설치하려면 다음 명령을 사용해야 합니다. 

pip install seaborn

 

명령 및 프롬프트에서 이 명령을 실행하면 다음과 같이 표시됩니다.

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
작성자 별 이미지

 

이제 seaborn을 사용하여 데이터를 시각화할 수 있습니다.

선 플롯

라인 플롯은 데이터 세트에서 2개의 다른 필드를 나타내거나 seaborn의 2개 필드 lineplot() 함수 간의 관계를 표시하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.lineplot(x='Preg', y='age', data=data)
plt.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

산포도

산점도는 데이터를 나타내는 데 점을 사용하는 seaborn 라이브러리의 scatterplot() 함수를 사용하여 두 필드 간의 관계를 나타내는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.scatterplot(x='Preg', y='age', data=data, hue='class')
plt.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

바 차트

막대 차트는 데이터를 표현하기 위해 seaborn 라이브러리의 barplot() 함수를 사용하여 범주형 데이터를 표현하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.barplot(x='Preg', y='age', data=data, hue='class')
plt.show()

 

출력:
 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

히스토그램

히스토그램은 데이터를 표현하기 위해 matplotlib 라이브러리의 histplot() 함수를 사용하여 그룹 형태로 데이터를 표현하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.histplot(x='age',kde=True, data=data, hue='class')
plt.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

Bokeh는 사물을 인터랙티브하게 만들어 데이터를 시각화하는 데 사용되며 웹 브라우저에서 데이터를 표현하기 위해 HTML과 javascript를 사용하며 높은 수준의 인터랙티브성을 가지고 있습니다.

seaborn을 설치하려면 다음 명령을 사용해야 합니다.

pip install bokeh

 

명령 프롬프트에서 이 명령을 실행하면 다음과 같이 표시됩니다.

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
작성자 별 이미지

 

이제 보케를 사용하여 데이터를 시각화할 수 있습니다.

선 플롯

라인 플롯은 데이터 세트의 서로 다른 두 필드를 나타내거나 보케에서 line() 함수를 사용하여 두 필드 간의 관계를 표시하는 데 사용됩니다.

파이썬에서 다음과 같이 코딩할 수 있습니다.

from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") df = data['age'].value_counts() graph.line(df, data['age'])
show(graph)

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

산포도

산점도는 데이터를 나타내는 데 점을 사용하는 보케 라이브러리의 scatter() 함수를 사용하여 두 필드 간의 관계를 나타내는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") df = data['age'].value_counts()
graph.scatter(df, data['age'])
show(graph)

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

바 차트

막대 차트는 데이터를 나타내는 보케 라이브러리의 vbar() 및 hbar() 함수를 사용하여 범주형 데이터를 나타내는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") graph.vbar(data['age'], top=data['Preg'])
show(graph)

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

Plotly는 그래프를 매력적으로 만들고 사용자 지정을 허용하는 데이터 시각화에도 사용됩니다.

plotly를 설치하려면 다음 명령을 사용해야 합니다.

pip install plotly

 

명령 프롬프트에서 이 명령을 실행하면 다음과 같이 표시됩니다.

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
작성자 별 이미지

 

이제 플롯을 사용하여 데이터를 시각화할 수 있습니다.

선 플롯

라인 플롯은 데이터 세트에서 2개의 다른 필드를 나타내거나 plotly에서 .line() 함수를 사용하여 2개의 필드 간의 관계를 표시하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.line(data, y='age', color='class')
fig.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

산포도

산점도는 점을 사용하여 데이터를 나타내는 plotly 라이브러리의 scatter() 함수를 사용하여 두 필드 간의 관계를 나타내는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.scatter(data, x='Preg', y='age', color='class')
fig.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

바 차트

막대 차트는 데이터를 표현하기 위해 plotly 라이브러리의 bar() 함수를 사용하여 범주형 데이터를 표현하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.bar(data, x='Preg', y='age', color='class')
fig.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?

히스토그램

히스토그램은 데이터를 표현하기 위해 matplotlib 라이브러리의 histogram() 함수를 사용하여 그룹 형태로 데이터를 표현하는 데 사용됩니다.

다음과 같이 파이썬으로 코딩할 수 있습니다.

import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.histogram(data, x='age', color='class')
fig.show()

 

출력:

 

데이터 시각화에 Python을 어떻게 사용할 수 있습니까?
 

다음은 Python 라이브러리를 사용하여 데이터를 시각화하는 다양한 방법입니다. 이제 논의된 내용을 간략하게 요약해 보겠습니다.

  1. 먼저 데이터 시각화가 무엇인지, 데이터 시각화를 왜 해야 하는지 알아보았습니다.
  2. 데이터 시각화에 대한 연구에는 데이터를 시각적 맥락에 넣어 데이터를 이해하여 다른 방법으로는 볼 수 없는 패턴, 추세 및 연결을 나타내려는 시도가 포함됩니다.
  3. 다음으로 Python을 사용하여 데이터 시각화를 수행하는 방법과 데이터 시각화를 위해 Python을 선택할 수 있는 이유를 살펴보았습니다.
  4. 우리는 Python을 사용하여 데이터 시각화를 위한 다양한 라이브러리를 보았습니다.
  5. 적절한 예제와 출력으로 작성된 샘플 코드로 각 데이터 시각화 기술을 이해했습니다.

Python과 다양한 유형의 라이브러리를 사용하여 데이터를 쉽게 시각화하는 지식을 얻었기를 바랍니다. 다음과 같은 무료 리소스에서 Python 및 다양한 라이브러리에 대해 자세히 알아볼 수 있습니다. 크드너겟, 스케일러위키.

 
 
Vaishnavi 아미라 야다 기술 콘텐츠 작가입니다. 그녀는 Python, Java, DSA, C 등에 대한 지식이 있습니다. 그녀는 글을 쓰는 자신을 발견했고 그것을 좋아했습니다.
 

spot_img

최신 인텔리전스

spot_img