<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>wsl -</title>
	<atom:link href="https://cyber-security.ba/tag/wsl/feed/" rel="self" type="application/rss+xml" />
	<link>https://cyber-security.ba</link>
	<description>Mjesto Gdje Sigurnost Sretne Inovaciju!</description>
	<lastBuildDate>Fri, 29 May 2026 22:42:54 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://cyber-security.ba/wp-content/uploads/2024/04/Logo-mali-white.png</url>
	<title>wsl -</title>
	<link>https://cyber-security.ba</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Kako instalirati lokalni AI na svoj računar: WSL2 + Ollama + NVIDIA</title>
		<link>https://cyber-security.ba/kako-instalirati-lokalni-ai-na-svoj-racunar-wsl2-ollama-nvidia/</link>
					<comments>https://cyber-security.ba/kako-instalirati-lokalni-ai-na-svoj-racunar-wsl2-ollama-nvidia/#respond</comments>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Fri, 29 May 2026 21:07:52 +0000</pubDate>
				<category><![CDATA[AI]]></category>
		<category><![CDATA[Operativni Sistemi]]></category>
		<category><![CDATA[ai]]></category>
		<category><![CDATA[llm]]></category>
		<category><![CDATA[ollama]]></category>
		<category><![CDATA[wsl]]></category>
		<guid isPermaLink="false">https://cyber-security.ba/?p=299</guid>

					<description><![CDATA[<p>Instalacija teških Docker paketa često može bespotrebno opteretiti hardverske resurse, što direktno utiče na performanse velikih jezičkih modela (LLM). U ovom uputstvu proći ćete kroz optimizovanu, &#8220;lightweight&#8221; metodu podizanja kompletnog vještačkog inteligentnog sistema direktno unutar Linux podsistema (WSL2), koristeći Python virtuelno okruženje i hardversko ubrzanje vaše NVIDIA grafičke karte. Korak 1: Instalacija i priprema WSL2...</p>
<p>The post <a href="https://cyber-security.ba/kako-instalirati-lokalni-ai-na-svoj-racunar-wsl2-ollama-nvidia/">Kako instalirati lokalni AI na svoj računar: WSL2 + Ollama + NVIDIA</a> first appeared on <a href="https://cyber-security.ba"></a>.</p>]]></description>
										<content:encoded><![CDATA[<p>Instalacija teških Docker paketa često može bespotrebno opteretiti hardverske resurse, što direktno utiče na performanse velikih jezičkih modela (LLM). U ovom uputstvu proći ćete kroz optimizovanu, &#8220;lightweight&#8221; metodu podizanja kompletnog vještačkog inteligentnog sistema direktno unutar Linux podsistema (WSL2), koristeći Python virtuelno okruženje i hardversko ubrzanje vaše NVIDIA grafičke karte.</p>
<hr />
<h2>Korak 1: Instalacija i priprema WSL2 okruženja</h2>
<p>Prije podizanja samog modela, potrebno je da osigurate da Windows podloga ima omogućen podsistem za Linux sa ispravnom verzijom kernela koja podržava GPU passthrough (prosljeđivanje grafičke karte).</p>
<ol>
<li style="list-style-type: none;">
<ol>
<li>Otvorite <strong>PowerShell kao Administrator</strong> na Windows domaćinu i izvršite komandu za instalaciju WSL-a i podrazumijevane Ubuntu distribucije:
<pre><code>wsl --install</code></pre>
</li>
<li>Ako je WSL već instaliran, izvršite ažuriranje Linux kernela na najnoviju stabilnu verziju:
<pre><code>wsl --update</code></pre>
</li>
</ol>
</li>
</ol>
<p>&lt;</p>
<ol>
<li>Restartujte računar ukoliko sistem to zahtijeva, a zatim kroz Windows Terminal, CMD ili PowerShell samo ukucajte komandu:
<pre><code>wsl</code></pre>
<p>i inicijalizujte Ubuntu distribuciju, kreirajte korisnički nalog i lozinku.</li>
</ol>
<hr />
<h2>Korak 2: Inspekcija početnog stanja i verifikacija hardvera</h2>
<p>Prije nego što započne instalacija Ollame, unutar pokrenutog Ubuntu terminala vrši se analiza mrežnog i hardverskog sloja kako bi se potvrdila ispravnost CUDA drajvera i mapiranje resursa.</p>
<h3>1. Provjera GPU Passthrough statusa i VRAM resursa</h3>
<p>Pokretanjem NVIDIA System Management Interface alata unutar WSL-a provjeravate da li Linux pravilno vidi grafički podsistem Windows domaćina:</p>
<pre><code>nvidia-smi</code></pre>
<p><img fetchpriority="high" decoding="async" class="aligncenter wp-image-305 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/01-smi.png" alt="" width="837" height="452" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/01-smi.png 837w, https://cyber-security.ba/wp-content/uploads/2026/05/01-smi-300x162.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/01-smi-768x415.png 768w, https://cyber-security.ba/wp-content/uploads/2026/05/01-smi-100x54.png 100w" sizes="(max-width: 837px) 100vw, 837px" /></p>
<p>&nbsp;</p>
<p>U izlazu sistema vidjećete potpunu tabelu i potvrđeno stanje vašeg hardvera (npr. <strong>NVIDIA GeForce RTX 5070 Ti</strong> sa oko <strong>16 GB VRAM-a</strong> i podrškom za <strong>CUDA API</strong>).</p>
<blockquote><p><strong>Sistemska bilješka:</strong> Maksimalna veličina LLM modela koji se može u potpunosti učitati u brzu grafičku memoriju (bez pada performansi usljed prelivanja u obični RAM) iznosi oko 12–13 GB, čime se ostavlja prostor za kontekstni prozor (Context Window) i prateće sistemske procese.</p></blockquote>
<h3>2. Skeniranje postojećih servisa i otvorenih portova</h3>
<p>Uvjerite se da na sistemu nema tragova ranijih instalacija koje bi mogle napraviti mrežni konflikt:</p>
<pre><code># Provjera Ollama binarne datoteke
ollama --version

# Provjera Docker engine-a
docker --version</code></pre>
<p>Ukoliko komande vrate <em>not found</em>, sistem je čist. Provjerite stanje mrežnih soketa i osluškivanja (listening ports) kako biste bili sigurni da su portovi <code>11434</code> (Ollama) i <code>8080</code> (WebUI) slobodni:</p>
<pre><code>ss -tuln</code></pre>
<h3>3. Ažuriranje indeksa paketa</h3>
<p>Pripremite Ubuntu okruženje za povlačenje potrebnih zavisnosti i paketa:</p>
<pre><code>sudo apt update</code></pre>
<hr />
<h2>Korak 3: Instalacija Ollama Engine-a na Linux podsistem</h2>
<p>Zvanična i preporučena metoda za instalaciju Ollame na Linux koja automatski konfiguriše sistemske servise i mapira CUDA drajvere jeste izvršavanje instalacione skripte.</p>
<p>Pokrenite instalaciju komandom:</p>
<pre><code>curl -fsSL https://ollama.com/install.sh | sh</code></pre>
<p><em>Napomena: Ukoliko sistem vrati grešku za <code>"zstd"</code>, instalirajte ga ručno preko <code></code></em></p>
<p><em><code>sudo apt-get install zstd -y</code> </em></p>
<p><em>pa ponovite gornju komandu: <code></code></em></p>
<p><em><code>curl -fsSL https://ollama.com/install.sh | sh</code></em></p>
<p>Nakon završetka, potvrdite uspješnu instalaciju provjerom trenutne verzije:</p>
<pre><code>ollama --version</code></pre>
<hr />
<h2>Korak 4: Konfiguracija mrežnog pristupa za Ollamu</h2>
<p>Po podrazumijevanim podešavanjima, Ollama se vezuje isključivo za lokalnu adresu <code>127.0.0.1</code>. Da bi eksterne aplikacije i web interfejsi mogli nesmetano komunicirati sa njom kroz mrežu, konfiguraciju vršimo direktnim kreiranjem <code>override.conf</code> datoteke:</p>
<ol>
<li>Kreirajte namjenski direktorijum za modifikaciju servisa i upišite environment varijablu za mrežni host:
<pre><code>sudo mkdir -p /etc/systemd/system/ollama.service.d
echo -e "[Service]\nEnvironment=\"OLLAMA_HOST=0.0.0.0\"" | sudo tee /etc/systemd/system/ollama.service.d/override.conf</code></pre>
</li>
<li>Osvježite systemd menadžer konfiguraciju kako bi sistem registrovao izmjene:
<pre><code>sudo systemctl daemon-reload</code></pre>
</li>
<li>Restartujte Ollama servis da bi se primijenile nove mrežne postavke:
<pre><code>sudo systemctl restart ollama</code></pre>
</li>
<li>Verifikujte da servis sada ispravno sluša na svim mrežnim interfejsima:
<pre><code>ss -tuln | grep 11434</code></pre>
<p>Znak <code>*</code> (ili <code>0.0.0.0</code>) u izlazu potvrđuje da je port otvoren i spreman za prijem upita sa eksternih adresa.</p>
<p><img decoding="async" class="aligncenter wp-image-313 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2.png" alt="" width="1086" height="307" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2.png 1086w, https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2-300x85.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2-1024x289.png 1024w, https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2-768x217.png 768w, https://cyber-security.ba/wp-content/uploads/2026/05/02-ollama-0.0.0.0-2-100x28.png 100w" sizes="(max-width: 1086px) 100vw, 1086px" /></li>
</ol>
<hr />
<h2>Korak 5: Strategija izbora modela i proračun VRAM memorije</h2>
<p>Prilikom odabira lokalnog LLM-a, ključno pravilo je da cijeli model mora stati u VRAM grafičke karte. Ako model pređe kapacitet grafičke memorije, performanse drastično opadaju (i do 10–20 puta) jer sistem prelazi na spori CPU i obični RAM.</p>
<p>Za proračun koristite formulu:<br />
<strong>Potreban VRAM = Veličina modela na disku + VRAM za Context Window (3–4 GB)</strong></p>
<table style="border-collapse: collapse; width: 100%;" border="1" cellpadding="5">
<thead>
<tr style="background-color: #f2f2f2;">
<th>Klasa hardvera</th>
<th>Preporučeni model</th>
<th>Veličina na disku</th>
<th>Minimalni VRAM</th>
<th>Zašto je idealan?</th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Standard</strong> (Većina korisnika)</td>
<td><strong>Llama 3 8B</strong> (ili Mistral 7B)</td>
<td>~4.7 GB</td>
<td>8 GB VRAM</td>
<td>Model od 8 milijardi parametara idealno staje u ekonomski pristupačne kartice, ostavljajući prostor za sistem.</td>
</tr>
<tr>
<td><strong>Advanced</strong> (Snažnije mašine)</td>
<td><strong>Gemma 2 9B</strong> (ili veći modeli)</td>
<td>~5.5 GB</td>
<td>16 GB VRAM</td>
<td>Daje daleko preciznije odgovore i naprednije logičko zaključivanje, a jače kartice ga izvršavaju u realnom vremenu.</td>
</tr>
</tbody>
</table>
<ul>
<li><strong>Pokretanje modela za širu publiku (Llama 3 8B):</strong>
<pre><code>ollama run llama3</code></pre>
</li>
<li><strong>Pokretanje naprednog modela (Gemma 2 9B):</strong>
<pre><code>ollama run gemma2:9b</code></pre>
</li>
</ul>
<p><em>Za izlazak iz interaktivnog chata u terminalu unesite:</em> <code>/exit</code></p>
<p><img decoding="async" class="aligncenter wp-image-315 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana.png" alt="" width="1054" height="644" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana.png 1054w, https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana-300x183.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana-1024x626.png 1024w, https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana-768x469.png 768w, https://cyber-security.ba/wp-content/uploads/2026/05/03-ollama-instalirana-100x61.png 100w" sizes="(max-width: 1054px) 100vw, 1054px" /></p>
<hr />
<h2>Korak 6: Monitoring resursa tokom rada</h2>
<p>Kako biste se uvjerili da model radi isključivo unutar grafičke karte, otvorite novi Ubuntu terminal dok model generiše odgovor i pokrenite komandu za praćenje u realnom vremenu:</p>
<pre><code>watch -n 1 nvidia-smi</code></pre>
<p><em>(Iz monitoringa izlazite kombinacijom tastera <code>Ctrl + C</code>)</em></p>
<p>Pratite sekciju <strong>Memory-Usage</strong> (potrošnja ne smije da prelazi granice vašeg VRAM-a) i <strong>GPU-Util</strong> (opterećenje jezgra koje skače na 90-100%), što je direktan dokaz da grafički procesor obavlja sav posao.</p>
<hr />
<h2>Korak 7: Instalacija Open WebUI interfejsa (Preko Python-a)</h2>
<p>Kako bismo izbjegli glomazne Docker pakete i dodatno rasteretili resurse, Open WebUI podižemo direktno unutar Ubuntu okruženja koristeći Python virtuelno okruženje (<code>venv</code>).</p>
<ol>
<li>Instalirajte Python 3 i potreban menadžer paketa:
<pre><code>sudo apt install python3-pip python3-venv -y</code></pre>
</li>
<li>Kreirajte namjenski direktorijum za web interfejs i aktivirajte izolovano okruženje:
<pre><code>mkdir open-webui-app &amp;&amp; cd open-webui-app
python3 -m venv venv
source venv/bin/activate</code></pre>
<p><em>Vidjećete oznaku <code>(venv)</code> na početku linije u terminalu, što znači da je okruženje uspješno aktivirano.</em></li>
<li>Instalirajte Open WebUI alat i prateće zavisnosti:
<pre><code>pip install open-webui</code></pre>
</li>
</ol>
<hr />
<h2>Korak 8: Pokretanje i pristup mrežnom interfejsu</h2>
<p>Pošto WSL2 radi unutar svoje izolovane mreže, prvo je potrebno da saznate trenutnu IP adresu vašeg Linux podsistema kako bi Windows mogao da locira interfejs.</p>
<ol>
<li>Unesite komandu za prikaz mrežne IP adrese:
<pre><code>ip addr show eth0 | grep inet</code></pre>
<p><em>U izlazu ćete vidjeti adresu podsistema (na primjer: 172.21.4.22)</em>.</p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-317 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/03.1-IP-adresa.png" alt="" width="706" height="263" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/03.1-IP-adresa.png 706w, https://cyber-security.ba/wp-content/uploads/2026/05/03.1-IP-adresa-300x112.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/03.1-IP-adresa-100x37.png 100w" sizes="auto, (max-width: 706px) 100vw, 706px" /></li>
<li>Pokrenite servis tako što ćete varijablu <code>HOST=<em>x.x.x.x</em></code> vezati za vašu specifičnu IP adresu podsistema:
<pre><code>HOST=172.21.4.22 PORT=8080 OLLAMA_BASE_URL=http://127.0.0.1:11434 open-webui serve</code></pre>
</li>
</ol>
<blockquote><p><strong>Važna napomena tokom pokretanja:</strong> Nakon što unesete ovu komandu, sistem će izgledati kao da je privremeno zaustavio rad na stavkama <code>Downloading...</code> ili <code>Download complete: 100%</code>. Nemojte prekidati proces! Open WebUI u pozadini preuzima svoje interne embedding biblioteke za pretragu i rad sa dokumentima. Kada se proces završi, server postaje potpuno aktivan.</p></blockquote>
<h3>Pristup chatu:</h3>
<p>Otvorite bilo koji browser na Windows hostu (domaćinu) i unesite dobijenu adresu i port:<br />
<code>http://172.21.4.22:8080</code></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-319 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui.png" alt="" width="752" height="452" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui.png 752w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-300x180.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-100x60.png 100w" sizes="auto, (max-width: 752px) 100vw, 752px" /></p>
<p>Prilikom prvog pristupa, sistem će od vas tražiti da kreirate novi Admin nalog. Pošto je sistem potpuno lokalnog karaktera, ovi podaci ostaju isključivo u lokalnoj bazi vašeg računara. U gornjem lijevom uglu izaberite učitani model i vaš lokalni ChatGPT je spreman za upotrebu.</p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-320 size-full" src="https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01.png" alt="" width="1108" height="694" srcset="https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01.png 1108w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-300x188.png 300w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-1024x641.png 1024w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-768x481.png 768w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-100x63.png 100w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-150x95.png 150w, https://cyber-security.ba/wp-content/uploads/2026/05/04-web-ui-01-400x250.png 400w" sizes="auto, (max-width: 1108px) 100vw, 1108px" /></p>
<hr />
<h2>Korak 9: Automatizacija i otvaranje sistema za lokalnu mrežu (LAN)</h2>
<p>Kako ne biste morali ručno da aktivirate virtuelno okruženje i kucate dugačke komande nakon svakog restarta, kreiraćemo pozadinski <code>systemd</code> servis koji će automatski podizati Open WebUI čim se WSL startuje/pokrene.</p>
<ol>
<li>Prekinite trenutni ručni proces u terminalu pritiskom na kombinaciju tastera <strong><code>Ctrl + C</code></strong>.</li>
<li>Otvorite novi konfiguracioni fajl kroz sistemski tekstualni editor:
<pre><code>sudo nano /etc/systemd/system/open-webui.service</code></pre>
</li>
<li>Unesite sljedeću konfiguraciju (prilagodite parametar <code>HOST</code> vašoj IP adresi podsistema):
<pre><code>[Unit]
Description=Open WebUI Service
After=network.target ollama.service
Requires=ollama.service

[Service]
Type=simple
User=freedole
WorkingDirectory=/home/freedole/open-webui-app
ExecStart=/home/freedole/open-webui-app/venv/bin/open-webui serve
Environment="HOST=172.21.4.22"
Environment="PORT=8080"
Environment="OLLAMA_BASE_URL=http://127.0.0.1:11434"
Restart=always
RestartSec=3

[Install]
WantedBy=multi-user.target</code></pre>
<p><em>(Sačuvajte izmjene sa <code>Ctrl + O</code>, potvrdite sa <code>Enter</code>, pa izađite iz editora sa <code>Ctrl + X</code>)</em></li>
<li>Aktiviraćete i pokrenuti kreirani servis u pozadini sljedećim komandama:
<pre><code>sudo systemctl daemon-reload
sudo systemctl enable open-webui.service
sudo systemctl start open-webui.service</code></pre>
</li>
</ol>
<h3>Prosljeđivanje portova za pristup iz LAN mreže</h3>
<p>Pošto WSL2 radi iza NAT-a, vaše kolege ili drugi uređaji iz lokalne mreže ne mogu direktno vidjeti internu <code>172.x.x.x</code> adresu. Da biste omogućili pristup preko prave IP adrese vašeg glavnog Windows računara (npr. <code>192.168.1.X</code>), otvorite <strong>Windows PowerShell kao Administrator</strong> i unesite sljedeće pravilo za portproxy (<code>connectaddress=172.21.4.22</code> zamijenite svojom adresom):</p>
<pre><code>netsh interface portproxy add v4tov4 listenport=8080 listenaddress=0.0.0.0 connectport=8080 connectaddress=172.21.4.22</code></pre>
<p>Ovom administrativnom komandom Windows preuzima saobraćaj sa glavne LAN mreže na portu <code>8080</code> i automatski ga prosljeđuje unutar Linux podsistema. Vaš lokalni AI server je sada u potpunosti autonoman, zaštićen i spreman za timski rad!</p><p>The post <a href="https://cyber-security.ba/kako-instalirati-lokalni-ai-na-svoj-racunar-wsl2-ollama-nvidia/">Kako instalirati lokalni AI na svoj računar: WSL2 + Ollama + NVIDIA</a> first appeared on <a href="https://cyber-security.ba"></a>.</p>]]></content:encoded>
					
					<wfw:commentRss>https://cyber-security.ba/kako-instalirati-lokalni-ai-na-svoj-racunar-wsl2-ollama-nvidia/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
