Sains data: Perbezaan antara semakan

Kandungan dihapus Kandungan ditambah
Kemaskini maklumat.
Pemikirkelana (bincang | sumb.)
Tiada ringkasan suntingan
Baris 4:
 
Pemenang penganugerahan Turing Jim Gray membayangkan sains data sebagai "paradigma keempat" sains (empirikal, teoritis, pengkomputeran dan kini didorong oleh data) dan menegaskan bahawa "segala sesuatu tentang sains berubah kerana kesan teknologi maklumat" dan banjir data.<ref name="TansleyTolle2009">{{cite book|author1=Stewart Tansley|author2=Kristin Michele Tolle|title=The Fourth Paradigm: Data-intensive Scientific Discovery|url=https://books.google.com/books?id=oGs_AQAAIAAJ|year=2009|publisher=Microsoft Research|isbn=978-0-9825442-0-4}}</ref><ref name="BellHey2009">{{cite journal|last1=Bell|first1=G.|last2=Hey|first2=T.|last3=Szalay|first3=A.|title=COMPUTER SCIENCE: Beyond the Data Deluge|journal=Science|volume=323|issue=5919|year=2009|pages=1297–1298|issn=0036-8075|doi=10.1126/science.1170411}}</ref>
 
=== Technologies ===
* [[Python (programming language)|Python]] adalah bahasa pengaturcaraan dengan sintaks sederhana yang biasanya digunakan untuk sains data.<ref>{{Cite web|url=https://sites.engineering.ucsb.edu/~shell/che210d/python.pdf|title=An introduction to Python for scientific computing|last=Shell|first=M Scott|date=September 24, 2019|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}}</ref> There are a number of python libraries that are used in data science including numpy, pandas, and scipy.
* [[R (programming language)|R]] adalah bahasa pengaturcaraan yang dibangunkann untuk ahli statistik dan perlombongan data<ref>{{Cite web|url=https://cran.r-project.org/doc/FAQ/R-FAQ.html#What-is-R_003f|title=R FAQ|website=cran.r-project.org|access-date=2020-04-03}}</ref> and is optimized for computation.
* [[TensorFlow]] adalah kerangka untuk membuat model pembelajaran mesin yang dikembangkan oleh Google.
* [[Pytorch]] adalah kerangka pembelajaran mesin yang dikembangkan oleh Facebook.
* [[Jupyter Notebook]] adalah muka web interaktif untuk pengaturcaraan yang membolehkan eksperimen dijalannkan dengan lebih pantas.
* [[Tableau Software|Tableau]] berfungsi untuk membuat pelbagai perisian yang digunakan untuk visualisasi data.<ref>{{Cite journal|url=https://www.wired.com/2014/07/a-drag-and-drop-toolkit-that-lets-anyone-create-interactive-maps/|journal=Wired|access-date=2020-04-03|title=A Dead-Simple Tool That Lets Anyone Create Interactive Maps|date=15 July 2014|last1=Rhodes|first1=Margaret}}</ref>
* [[Apache Hadoop]] is a software framework that is used to process data over large distributed systems.
 
== Rujukan ==