Dénes Csala PRO
Assistant Professor| Blogger | Datactivist
Dr Csala Dénes
UBB FSEGA
2023 tavasz
Microsoft
gépi tanulás
Arecibo Interstellar Message - wikimedia.com
Tárol
Kielemez
Segíti a érvelést, gondolatmenetet
Közöl
Bevon
Meggyőz
ATLO - atlatszo.hu
Chartmaker - Any Kirk - visualisingdata.com
ezelink.com
vividcomm.com
fmsystems.com
Arecibo Interstellar Message - wikimedia.com
The Opte Project
Amazon Web Services
Host name
sudo bash
apt-get update
apt-get upgrade
apt-get install \
apt-transport-https \
ca-certificates \
curl \
gnupg-agent \
software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
add-apt-repository \
"deb [arch=amd64] https://download.docker.com/linux/ubuntu \
$(lsb_release -cs) \
stable"
apt-get update
apt-get install docker-ce docker-ce-cli containerd.io
docker run hello-world
docker ps
sudo snap instal docker
docker volume create portainer_data
docker run -d -p 8000:8000 -p 9000:9000 --name=portainer --restart=always \
-v /var/run/docker.sock:/var/run/docker.sock \
-v portainer_data:/data portainer/portainer
docker ps
your-host-name.amazonaws.com:9000
Portainer!
docker ps
docker ps -a
docker ps -q
docker ps -aq
docker stop 37e4eb95ddad
docker start 37e4eb95ddad
docker stop 37e4eb95ddad
docker rm 37e4eb95ddad
docker ps
(linux only)
docker stop `docker ps -q`
(linux only)
docker rm `docker ps -aq`
docker run -p 8888:8888 jupyter/base-notebook
docker run -d -p 8888:8888 jupyter/base-notebook
docker ps -q
docker exec -it <mycontainer> bash
jupyter lab list
exit
(CLEANUP)
https://www.digitalocean.com/community/tutorials/how-to-remove-docker-images-containers-and-volumes
docker system prune
(CAUTION!)
docker system prune -a
docker run -p 3000:3000 --name grafana grafana/grafana
docker run -d -p 3000:3000 --name grafana grafana/grafana
// alap user/jelszó: admin/admin
docker run -p 8888:8888 -v chronograf:/var/lib/chronograf chronograf
docker run -p 8889:8888 -v chronograf:/var/lib/chronograf chronograf
docker run -d -p 8889:8888 -v chronograf:/var/lib/chronograf chronograf
docker run -p 8083:8083 -p 8086:8086 -v influxdb:/var/lib/influxdb influxdb:1.8
docker run -d -p 8083:8083 -p 8086:8086 -v influxdb:/var/lib/influxdb influxdb:1.8
(linux only)
curl -G http://localhost:8086/query --data-urlencode "q=SHOW USERS"
docker run -d -p 8083:8083 -p 8086:8086 -v influxdb:/var/lib/influxdb influxdb
version: '3'
services:
grafana:
image: grafana/grafana
container_name: grafana
restart: always
ports:
- '3000:3000'
influxdb:
image: influxdb:1.8
container_name: influxdb
restart: always
ports:
- '8086:8086'
- '8083:8083'
version: '3'
services:
grafana:
image: grafana/grafana
container_name: grafana
restart: always
ports:
- '3000:3000'
volumes:
- ./az_en_grafana_mappam:/var/lib/grafana
version: '3'
services:
grafana:
image: grafana/grafana
container_name: grafana
restart: always
ports:
- '3000:3000'
volumes:
- ./az_en_grafana_mappam:/var/lib/grafana
networks:
dc2net:
ipv4_address: 172.28.1.1
networks:
dc2net:
ipam:
driver: default
config:
- subnet: 172.28.0.0/16
version: '3'
services:
grafana:
image: grafana/grafana
container_name: grafana
restart: always
user: '0'
ports:
- '3000:3000'
volumes:
- ./az_en_grafana_mappam:/var/lib/grafana
networks:
dc2net:
ipv4_address: 172.28.1.1
networks:
dc2net:
ipam:
driver: default
config:
- subnet: 172.28.0.0/16
version: '3'
services:
grafana:
image: grafana/grafana
container_name: grafana
restart: always
user: '0'
ports:
- '3000:3000'
volumes:
- ./az_en_grafana_mappam:/var/lib/grafana
networks:
dc2net:
ipv4_address: 172.28.1.3
chronograf:
image: chronograf
container_name: chronograf
restart: always
ports:
- '8889:8888'
volumes:
- ./az_en_chronograf_mappam:/var/lib/chronograf
networks:
dc2net:
ipv4_address: 172.28.1.4
influxdb:
image: influxdb
container_name: influxdb
restart: always
ports:
- '8086:8086'
- '8083:8083'
volumes:
- ./az_en_influxdb_mappam:/var/lib/influxdb
networks:
dc2net:
ipv4_address: 172.28.1.2
jupyter:
image: jupyter/base-notebook
container_name: jupyter
restart: always
user: '0'
ports:
- '8888:8888'
volumes:
- ./az_en_jupyter_mappam:/home/jovyan/work
networks:
dc2net:
ipv4_address: 172.28.1.1
networks:
dc2net:
ipam:
driver: default
config:
- subnet: 172.28.0.0/16
mkdir az_en_projektem
cd az_en_projektem
<ide jön a docker-compose.yml>
docker-compose up
docker-compose down
docker-compose up -d
docker-compose down --volumes
version: '3'
services:
jupyter:
build: ./az_en_jupyter_mappam
container_name: jupyter
restart: always
user: '0'
ports:
- '8888:8888'
volumes:
- ./az_en_jupyter_mappam:/home/jovyan/work
FROM jupyter/base-notebook
RUN pip install pandas
RUN pip install influxdb
ENTRYPOINT ["jupyter", "lab", "--ip=0.0.0.0", "--allow-root" , "--NotebookApp.token=UBBxBI2"]
import pandas as pd
from influxdb import DataFrameClient
user = 'root'
password = 'root'
host='influxdb' #172.28.1.2 #localhost #3.14.5.146 - kozos osztaly InfluxDB szerver
port=8086
dbname='base' #az en adatbazis nevem
protocol = 'line' #json
client = DataFrameClient(host, port, user, password, dbname)
client.query('show databases')
client.drop_database(dbname)
client.drop_retention_policy(dbname)
client.create_database(dbname)
client.create_retention_policy(dbname, '1000d', 1, default=True)
client.query('show databases')
import time
from random import randrange
measurement='teszt'
for i in range(5000):
now=pd.to_datetime('now')
value=randrange(10)
print(now)
time.sleep(2)
data={'a':{'date':now,'value':value,'szin':'piros','nev':'Denes'}}
df=pd.DataFrame(data).T.set_index('date')
df.index=pd.to_datetime(df.index)
df['value']=df['value'].astype(int)
client.write_points(df, measurement, protocol=protocol,
field_columns=['value'],
tag_columns=['szin','nev'])
print('success')
Andrew Ng - Stanford University Machine learning course
Andrew Ng - deeplearning.ai
Microsoft Machine Learning
Google Digital Workshop
Datacamp: Machine Learning for Business course
Towards Data Science blog
Szegedi Egyetem gépi tanulás kurzus
Budapesti Műszaki Egyetem gépi tanulás kurzus
Olvasd el: Forbes
1. Rendet rakni egy rendetlen világban
Meghatározások
2. Kicsi, nagy, összetett problémák megoldása
Meghatározások
3. Üzleti problémák megoldása
Meghatározások
A gépi tanulás (ML) matematikai adatmodellekkel tanít be számítógépeket közvetlen felügyelet nélkül. Ez a mesterséges intelligencia (AI) egy részhalmaza. A gépi tanulás algoritmusokkal azonosít mintákat az adatokban, amelyekkel ezután adatmodellt készít, és előrejelzéseket végez. A gépi tanulás eredményei az adatok és a tapasztalat mennyiségének növekedésével egyre pontosabbak – ahogyan az emberek is egyre ügyesebbé válnak a gyakorlás által.
A gépi tanulás rendkívül könnyen alkalmazkodik különböző helyzetekhez, így ideális olyan forgatókönyvekben, ahol az adatok folyamatosan változnak, a kérés vagy feladat típusa módosulhat, vagy egy megoldás kódolása szinte lehetetlen lenne.
Meghatározások
A gépi tanulás a mesterséges intelligencia részhalmazának tekintendő. Egy „intelligens” számítógép emberi gondolkodást kísérel meg, és egyedül hajt végre feladatokat. A számítógépek emberi logika használatára való betanításának egyik módja egy neurális hálózat használata, amely olyan algoritmusok sorozata, amelyek az emberi agy modellje alapján készültek.
Habár a gépi tanulás a prediktív elemzés egyik típusa, fontos különbség a kettő között az, hogy a gépi tanulást jelentősen könnyebb bevezetni valós idejű frissítésekkel, ahogy egyre több adatot gyűjt. A prediktív elemzés általában statikus adatkészlettel működik, és rendszeresen frissíteni kell.
A mély tanulás a gépi tanulás egy speciális formája, amely neurális hálózatokkal szolgáltat válaszokat. A mély tanulás képes egyedül pontosságot mérni, az adatokat pedig az emberi agyhoz hasonlóan osztályozza – így a létező legemberibb mesterséges intelligenciák működését is segíti.
A gépi tanulásnak számos alkalmazási módja van, a lehetőségek tárháza pedig egyre szélesebb. Íme a technológia néhány legnagyobb előnye, amelyet már számos vállalkozás kihasznál.
Előnyei
A gépi tanulással azonosítható mind a strukturált, mind a strukturálatlan adatokban rejlő minta vagy szerkezet, így könnyebben látható, mit is mutatnak az adatok.
A gépi tanulás kiválóan használható az adatbányászatban, sőt akár annak lehetőségeit is képes kiterjeszteni.
Előnyei
Adaptív interfészek, célzott tartalom, csevegőrobotok, hangvezérelt virtuális asszisztensek – ezek mind példák arra, hogy a gépi tanulás hogyan segíthet optimalizálni az ügyfélélményt.
Mivel a csalási taktikák folyamatosan változnak, a gépi tanulásnak lépést kell tartani velük – képesnek kell lennie megfigyelni és azonosítani az új mintákat, hogy megelőzhesse a rosszindulatú próbálkozásokat.
Előnyei
A gépi tanulással ügyfélhez kapcsolódó adatok bányászhatók, amelyekkel könnyebben azonosíthatók minták és viselkedésmódok, ami optimalizált termékjavaslatokat és a lehető legjobb vásárlói élményt eredményezheti.
A gépi tanulás jelentős szintű folyamatautomatizálást tesz lehetővé, ami időt és erőforrásokat szabadít fel, Ön és csapata így a legfontosabb ügyekre összpontosíthat.
Előnyei
A regressziós algoritmusok értékekből hoznak létre modellt, amely alapján előrejelzéseket készíthetnek. Ez hasznos a változók okainak és okozatainak azonosításában. A regressziós tanulmányok segítenek előrejelezni a jövőt, ami segíthet a termékekre vonatkozó igényének előrejelzésében, az értékesítési számadatok tervezésében, vagy a kampányeredmények megbecslésében.
Felhasználása
Az anomáliadetektálási algoritmusokat gyakran használják lehetséges kockázatok észlelésére, ugyanis képesek kiszűrni a várt normától eltérő adatokat. Berendezések meghibásodása, szerkezeti hibák, szöveges hibák, valamint csalások – néhány példa arra, hogy a gépi tanulás hogyan használható veszélyforrások esetén.
Felhasználása
A fürtözési algoritmusok gyakran a gépi tanulás első lépését képezik, és az adatkészlet mögöttes struktúráját fedik fel. A gyakori elemek kategorizálása – a fürtözés – gyakori eljárás a piaci szegmentálásban, és olyan elemzéseket nyújthat, amelyek elősegítik a megfelelő ár kiválasztását, valamint az ügyfelek preferenciáinak megjósolását.
Felhasználása
A besorolási algoritmusok segítenek meghatározni az információk megfelelő kategóriáját. A besorolás a fürtözéshez hasonlít, azonban eltér abban, hogy a felügyelt tanulásban alkalmazzák, ahol előre meghatározott címkék szerepelnek.
Felhasználása
A kockázatkezelés és a csalások megelőzése olyan kulcsfontosságú területek, ahol a gépi tanulás hatalmas hozzáadott értéket jelent a pénzügyi környezetekben.
Iparágak
Diagnosztikai eszközök, páciensfigyelés és járványok előrejelzése – néhány példa arra, hogy a gépi tanulás hogyan segíthet a páciensek kezelésének továbbfejlesztésében.
Forgalmi anomáliák azonosítása, kézbesítési útvonal optimalizálása, önvezető autók – néhány példa arra, hogy a gépi tanulás hogyan javíthat a szállítmányozás minőségén.
Iparágak
Kérdések megválaszolása, az ügyfélszándék megbecslése, virtuális segítségnyújtás – néhány példa arra, hogy a gépi tanulás hogyan képes támogatni az ügyfélszolgálati ipart.
A gépi tanulással a kiskereskedők könnyebben elemezhetnek vásárlási mintákat, optimalizálhatják az ajánlatokat és a díjszabást, valamint használhatják az adatokat az ügyfélélmény javítására.
Iparágak
A munkaerőhiányt pótló robotok fejlesztése, növényi betegségek diagnosztizálása, vagy a talajminőség figyelése – néhány példa arra, hogy a gépi tanulás miként segíthet a mezőgazdaság fejlesztésében.
Iparágak
Címkékkel vagy struktúrával ellátott adatkészletek esetén az adatok „betanítják” a gépet, így az hatékonyabban végezhet előrejelzéseket és hozhat döntéseket.
Adatok fürtökbe való csoportosításával könnyebben foglalkozhat címkék vagy struktúra nélküli adatokkal, valamint azonosíthat mintákat és kapcsolatokat.
Az ügynök (valaki vagy valami nevében tevékenykedő számítógépprogram) az emberi operátort helyettesíti, és segít egy visszajelzési hurok alapján meghatározni az eredményt.
Tanulási technikák
Tanulási technikák
Tanulási technikák
A könnyen beállítható és üzembe helyezhető felhő ideális bármilyen méretű számítási feladat kezeléséhez, Ön így igény szerint csatlakoztathat és méretezhet adatforrásokat anélkül, hogy ehhez szükséges speciális tudásra lenne szüksége.
Környezet
Az ideális platform minden képzettségi szintet támogat akadálymentes szerzői lehetőségekkel. Segítségével kihasználhatja a gépi tanulás előnyeit, akár főleg kódokkal dolgozik, akár kódolást nem igénylő, automatizált eszközöket és húzással működő felületeket szeret inkább használni.
Környezet
Akár ONNX, Python, PyTorch, scikit-learn vagy TensorFlow könyvtárat használ, olyan platformot célszerű alkalmaznia, amelyben a már jól ismert és kedvelt eszközeivel dolgozhat.
Környezet
Olyan platformot keressen, amely nagyvállalati szintű cégirányítást, biztonságot és vezérlést nyújt az infrastruktúra védelme érdekében.
Az adatforrások azonosítása után a rendszer lefordítja a rendelkezésre álló adatokat. A felhasználható adattípusok segítenek meghatározni, hogy mely gépi tanulási algoritmusokat használhatja. Az adatok áttekintésekor a rendszer azonosítja az anomáliákat, kialakít egy struktúrát, valamint megoldja az adatintegritással kapcsolatos problémákat.
Lépések
Az előkészített adatok két csoportra oszlanak: egy betanítási készlet és egy tesztelési készlet. A betanítási készlet az adatok nagy része, amellyel a modelleket a lehető legpontosabban finomhangolhatja.
Lépések
Ha készen áll a végső adatmodell kiválasztására, a tesztelési készlettel kiértékelheti a teljesítményt és a pontosságot.
Lépések
Tekintse át az eredményeket, és végezze el az elemzéseket, vonja le a következtetéseket, és tervezze meg a kimeneteket.
Lépések
Példák
https://colab.research.google.com/github/jakevdp/PythonDataScienceHandbook/blob/master/notebooks/05.02-Introducing-Scikit-Learn.ipynb#scrollTo=-lRBrg12-kbg
https://campus.datacamp.com/courses/machine-learning-for-everyone/machine-learning-models?ex=4
https://campus.datacamp.com/courses/data-science-for-business/prediction?ex=1
https://campus.datacamp.com/courses/machine-learning-for-business/machine-learning-types?ex=1
Példák
By Dénes Csala