Pokazywanie postów oznaczonych etykietą informatyka. Pokaż wszystkie posty
Pokazywanie postów oznaczonych etykietą informatyka. Pokaż wszystkie posty

Zestawienie kart graficznych - CUDA

Współcześnie (2018.07.05) do testów używam układ NVS5200m, o dosyć skromnych możliwościach (renderuje 400 klatek mniej od obecnie top'owego fermi 2.1)
http://www.gpuzoo.com/GPU-NVIDIA/Quadro_NVS_5200M.html

NVS-5200M (Fermi)
96 cores, 1 GHz
1 GB, 14 GB/s, 64 b.
CUDA compute capability 2.1

GeForce GTX 750 Ti (Maxwell)
640 cores, 1 GHz
2 GB, 86 GB/s, 128 b.
CUDA compute capability: 5.0

GTX 660 TI (Kepler, GK104)
1344 cores, 1 GHz
2 GB, 144 GB/s, 192 b.
CUDA compute capability: 3.0
2,5 TFLOPS Single-precision floating point performance

GeForce GTX 960 (Maxwell)
1024 cores, 1,1 GHz
2 GB, 86 GB/s, 128 b.
CUDA compute capability: 5.2

GeForce GTX 980 (Maxwell)
2048 cores, 1,1 GHz
4 GB, 224 GB/s, 256 b.
CUDA compute capability: 5.2

GeForce GTX 1050 (Pascal)
640 cores, 1,3 GHz (2 GB)
768 cores, 1,3 GHz (4 GB)
112 GB/s, 128 b.
CUDA compute capability: 6.1

GeForce GTX 1060 (Pascal)
1152 cores, 1,5 GHz (3 GB)
1280 cores, 1,5 GHz (6 GB)
192 GB/s, 192 b.
CUDA compute capability: 6.1
4 TFLOP/s Single-precision floating point performance

GeForce GTX 1070 (Pascal)
1920 cores, 1,5GHz
8 GB, 256 GB/s, 256 b.
CUDA compute capability: 6.1
6 TFLOP/s Single-precision floating point performance

GeForce GTX 1080 (Pascal)
2560 cores, 1,6 GHz
8 GB, 320 GB/s, 256 b.
CUDA compute capability: 6.1
9 TFLOPS

Tesla K80 (2 x GK210)(Kepler)
4992 cores (2 x 2496), 0,6 GHz
24 GB ECC (2 x 12 GB), 2 x 240 GB/s, 384 b.  - GDDR5
CUDA compute capability: 3.7
5,6 TFLOPS (taktowanie standardowe), 8,74 TFLOPS (taktowanie Boost) - Single-precision floating point performance
Wydajność obliczeń o podwójnej precyzji do 2,91 Teraflops z wykorzystaniem technologii NVIDIA GPU Boost
Wydajność obliczeń o pojedynczej precyzji do 8,74 Teraflops z wykorzystaniem technologii NVIDIA GPU Boost

Tesla P100 (Pascal)
3584 cores
16 GB 732 GB/s
12 GB 549 GB/s
9,3 TFLOPS Single-precision floating point performance (PCIe)
10,6 TFLOPS Single-precision floating point performance (NVLink)

Titan X (Pascal GP102)
3584 cores, 1,4 GHz    - 1531 MHz w trybie GPU Boost 3.0, 56-procesorów strumieniujących, 224-TMU i 96-ROP.
12 GB, 480 GB/s, 384 b.  - GDDR5X - jest to jedna z najszybszych technologii pamięci na świecie.
CUDA compute capability: 6.1
11 TFLOPS Single-precision floating point performance


Dla porównania dane procesora ogólnego przeznaczenia:
i7-3740QM CPU @ 2.70GHz (Ivy Bridge)
Max. memory bandwidth: 25.6 GB/s
0,172 TFLOPS



Efektywność energetyczna: 

T10 GPU wydany w 2010 roku: 2 GFLOPS/W
Fermi GPU wydany w 2010 roku: 3 GFLOPS/W
Kepler GPU wydany w 2012 roku: 25 razy wydajniejszy od Fermi 6 GFLOPS/W
Maxwell GPU wydany w 2014 roku: 35 razy wydajniejszy od Kepler 16 GFLOPS/W
Pascal GPU wydany w 2016 roku: 10 razy wydajniejszy od Maxwell.


********

Więcej informacji:
Informatyka, FreeBSD, Debian


***

Inne wpisy:



Update: 2018.07.17
Create: 2018.07.17

DNS speed test

Program testujący szybkość serwera DNS wymaga zainstalowania (Python interface to Tcl/Tk):
yum install tkinter
Sam tester pobieramy i rozpakowujemy:
wget https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/namebench/namebench-1.3.1-source.tgz
tar xvfvz namebench-1.3.1-source.tgz
Test inicjujemy poleceniem dopytującym serwery z pliku "resolv.conf":
./namebench.py -S
Test pobiera 2000 najpopularniejszych stron z serwisu Alexa i używa tych adresów do przeprowadzenia testów:
Przykładowe wyniki testów można zobaczy w tym wpisie: DNS cache: pdsnd



********

Więcej informacji:
Informatyka, FreeBSD, Debian


***

Inne wpisy:



Update: 2018.07.17
Create: 2018.07.17

DNS cache: pdsnd

Obecnie bardziej jest popularne oprogramowanie "dnsmasq", ale z serwera "pdnsd" korzystam od lat i często wykorzystuję te przetestowane oprogramowanie. Uwaga: należy rozróżnić programy "pdns" i "pdnsd". Instalacja:
#http://members.home.nl/p.a.rombouts/pdnsd/dl.html
wget http://members.home.nl/p.a.rombouts/pdnsd/releases/pdnsd-1.2.9a-par.src.rpm
yum install rpm-build
yum groupinstall "Development tools"
rpmbuild --rebuild pdnsd-1.2.9a-par.src.rpm

W przypadku problemów z kompilacją, lub zgodnościami można ściągnąć paczkę i ja zainstalować:
rpm -i pdnsd-1.2.9a-par_sl6.x86_64.rpm

Następnie należy sprawdzić, czy coś już nie słucha na porcie 53:
netstat -lnp4 |grep 53

Po sprawdzeniu można uruchomić daemon'a:
/etc/init.d/pdnsd start

Przykładowy plik konfiguracyjny:
Config:
global {
perm_cache = 8182;
cache_dir = "/var/cache/pdnsd";
run_as="pdnsd";
server_ip = 127.0.0.1;
#interface = ;
linkdown_kluge=on;
status_ctl = on;
paranoid = off;
query_method = udp_only;
tcp_server = off;
min_ttl = 60m;
max_ttl = 1w;
timeout = 10;
proc_limit = 1;
randomize_recs = on;
udpbufsize = 2048;
}
server {
label = pula_serwerow;
uptest = query;
interval = 30;
preset = off;
query_test_name = ".";
ping_timeout = 30;
timeout = 5;
purge_cache = off;
caching = on;
ip = 10.9.16.110.9.8.2391.193.144.114; #atos/amg
ip = 10.105.60.205; #atos/amg
ip = 8.8.8.88.8.4.4; #google
}
#server {
# label = "root-servers";
# root_server = on;
# exclude = .localdomain;
# policy = included;
# ip = discover;
# ip = 198.41.0.4,
192.228.79.201,
192.33.4.12,
128.8.10.90,
192.203.230.10,
192.5.5.241,
192.112.36.4,
128.63.2.53,
192.36.148.17,
192.58.128.30,
193.0.14.129,
198.32.64.12,
202.12.27.33;
#}
 
source {
owner = localhost;
# serve_aliases = on;
file = "/etc/hosts";
}
rr {
name = localhost;
reverse = on;
a = 127.0.0.1;
owner = localhost;
soa = localhost,root.localhost,42,86400,900,86400,86400;
}

Przykładowe testy: 
Dla serwerów sashabibi i jenna wykonałem test serwerów DNS: 10.9.16.1 i 10.9.8.23:  DNS speed test
(wpisy zastane w resolv.conf i zgodne z ip DNS przyznawanymi przez DHCP w LAN'ie)
Wyniki nie uwzględniają odpytań serwera 10.9.8.23, ponieważ jest niedostępny dla ww. serwerów.
Czwarta konsola pokazuje rezultat testów  laptopa podłączonego w LAN'ie. Na adresie 127.0.0.1 słucha DNS cache "pdnsd":

Następnie ten sam test wykonałem po uruchomieniu usługi "pdnsd":

Test serwera 10.9.16.1 z laptopa w sieci LAN:

Zestawienie wyników:
 
Czas najszybszej odpowiedzi
10.9.16.1
(ms)
Średni czas odpowiedzi
10.9.16.1
(ms)
Czas najszybszej odpowiedzi
127.0.0.1
(ms)
Średni czas odpowiedzi
127.0.0.1
(ms)
sasha:1,2134,01,5126
bibni:1,5235,21,269,0
jenna:1,3124,01,1111,1
laptop:1,169,00,512,0

Te uproszczone testy pozwalają wnioskować, że zastosowanie lokalnego cache DNS zmniejsza średni czas odpowiedzi. Lepsze rezultaty uzyska się na mniej przeciążonych serwerach, a znaczenie tej modyfikacji zależy od ilości zapytań do serwerów DNS generowanych przez aplikację (np.: od liczby nawiązywanych połączeń na sekundę).



********

Więcej informacji:
Informatyka, FreeBSD, Debian


***

Inne wpisy:



Update: 2018.07.17
Create: 2018.07.17