Dyskusja Wikiprojektu:Sprzątanie kodu
Z Wikipedii
linki typu [[ang.]] -> [[Język angielski|ang.]]
(...)
linki typu [[Gdzieś|gdzieś]] -> [[gdzieś]]
więc jeśli coś nie jest nazwą własną to małą czy wielką literą? trzeba się zdecydować
- linki powinny być z dużej litery (IMHO oczywiście), gdyż do takich adresów kierują. Sprawdz choćby ten ang. Prowadzi do Ang. Natomiast gdy w tekście używa się małej litery to dobrze, bo przecież nie będzie bot wstawiał czegoś takiego jak [[Link|link]]. Duża litera powinna być tylko gdy istnieje opis. A_Bach - ΣΦ 14:57, 6 sty 2007 (CET)
- a wg opinii innych (np. patrz edycje Beno) piszących wszędzie ortograficznie, powinny być małą (wielka sugeruje niepoprawną pisownię), link nie kieruje do nazwy pisanej wielką literą ale jest ona tylko w ten sposób wyświetlana (tytuły sekcji itp. też są pisane wielkimi literami, podobnie jak rozdziały i podrozdziały w książkach, ale odnośniki w tekście prowadzące do nich, już małymi), jako że jest to początek artykułu i aby to "jakoś" wyglądało (mechanizm sam zmienia małą literę na wielką, stąd powinno się pisać małą w przypadku nazw niebędących nazwami własnymi), w przypadku który podałem widać niekonsekwencję, bo raz mimo tego że link jest "kierowany" do art. z wielką literą (z błędem ortograficznym, nie widzianym co prawda w artykule, ale w polu edycji już tak), a raz z małą (dla uproszczenia) --gregul 15:13, 6 sty 2007 (CET)
a kilkadziesiąt wpisów w stylu
[[Category:Coś_tam_dalej -> [[Kategoria:Coś_tam_dalej
(...)
[[kategoria :coś_tam_dalej -> [[Kategoria:Coś_tam_dalej
można zastąpić \[\[(kategoria|category) ?: ? -> [[Kategoria:
ci co mają zrozumieć zrozumieją (i ewentualnie dostosują do własnego oprogramowania) --gregul 14:21, 6 sty 2007 (CET)
- Chodziło mi o to, by wszyscy zrozumieli, bo jeśli taki by bot poszedł, to tylko za zgodą społeczności, a nie tylko tych co znają programowanie. A_Bach - ΣΦ 14:57, 6 sty 2007 (CET)
- a mam kilkaset tego typu zmian spisanych (zaliczając zamianę powyższych kategorii jako jedną zmianę), więc nie sądzę żeby taki bot został masowo uruchomiony, przykłady:
-
- w datach np. [[14 września]], [[1999]] występuje niepotrzebny przecinek (ponad 700 artów do poprawy)
-
- a mam kilkaset tego typu zmian spisanych (zaliczając zamianę powyższych kategorii jako jedną zmianę), więc nie sądzę żeby taki bot został masowo uruchomiony, przykłady:
-gut idea
-
-
-
- usunięcie spacji z \d (%|‰|°)
-
-
-gut idea
-
-
-
- linki typu \[\[((G|g)iga|(M|m)ega|(K|k)ilo)herc\| zmiana na [[herc|
-
-
-tu leciały osobne boty tylko na to
- no właśnie, LECIAŁY, a wciąż powstają nowe, razem z [[kHz, [[MHz jest ich ponad 200 więc nie są to pojedyncze rzeczy --gregul 19:30, 6 sty 2007 (CET)
-
-
- \[\[(M|k)Hz\]\] j.w.
-
-
-j.w.
-
-
-
- \.\]\]\. na .]] – 2 kropki na końcu zdania
-
-
-nie tak, a tak: ]].
może i słusznie, poprawiłem w swoich regułkach --gregul 19:30, 6 sty 2007(CET)- to co napisałeś \.\]\] na ]]., kłóci się z [[język angielski|ang.]], rozumiem że wg ciebie powinno być [[język angielski|ang]]. ?--gregul 14:57, 7 sty 2007 (CET)
- jednak to co napisałem najpierw jest jedyną sensowną wersją, czyli .]]. na .]]--gregul 23:09, 9 sty 2007 (CET)
-
-
- można też w końcu zaczac zapisywać poprawnie "sp. z.o.o." jako że występują rozmaite kombinacje i nawet nie ruszając wielkiej litery "S" która zawsze prawie wystepuje na początku tego skrótu (niesłusznie) to pod wyrażenie p\. *z\.? *o\.? *o\.? łapie się sporo artów, chyba że już je kiedyś poprawiłem (zawiera się w niej też prawidłowy ciąg, ale to akurat nie ma znaczenia)
-
-
-ortografów nie chcę ruszać, ze zwzględów oczywistych.
-
-
-
- jeśli ang. -> język angielski to też niem. -> język niemiecki i pozostałe języki itd.
-
-
-napisałem "linki typu" a nie że tylko ang. :)
-
-
- w skrócie pisząc, takich zmian jest bardzo dużo i trzeba je miesiącami gromadzić ;] --gregul 15:33, 6 sty 2007 (CET)
-
[edytuj] ==Tekst==
a tu co się narobiło?
=Tekst=\n -> = Tekst =\n
==Tekst==\n -> == Tekst ==\n
===Tekst===\n -> === Tekst ===\n
w ==Zobacz też== jest odwrotnie (jedni kasują spacje, a inni chcą dodawać), pozatym istnieją też teksty objęte czterema "=" --gregul 13:06, 8 sty 2007 (CET)
[edytuj] kolejny błąd w waszym kodzie
kropka na końcu opisu grafiki może być kropką następującą po skrócie np. Fotografia z 1920 r., ewentualnie inny skrót np. XX w. itd. --gregul 15:35, 9 sty 2007 (CET)
w $text =~ s/\s*\n\s*\n(===?)\s*(Zobacz|Patrz) też:?\s*===?\s*\n/\n\n$1 Zobacz też $1\n/;
też błąd, bo zamiast == może wstawić === --gregul 21:22, 9 sty 2007 (CET)
- Z tego co mi się wydaje to trzy === wstawi tylko wtedy gdy istnieją. Jak były po dwa to zostaną po dwa. Wg mnie nie należy zmieniać poziomu tego nagłówka, bo może to zaburzyć hierarchię całego dokumentu. ~malarz pl PISZ 16:05, 12 sty 2007 (CET)
[edytuj] Ad. zmiany
Dodałem pipe'a na początek, ponieważ niektóre hasła kończą się na kropkę, więc z Nice. zrobilibyście w artykułach o Puffy AmiYumi Nice. :) Hołek ҉ 10:46, 13 sty 2007 (CET)
to się kłóci z [[język angielski|ang.]], poza tym takie coś tez musi wyłapać [[n.p.m.]]. --gregul 17:06, 13 sty 2007 (CET)
- IMHO lepiej nie ruszać w ogóle kropki. Za dużo z nią problemów. A_Bach - ΣΦ 22:30, 13 sty 2007 (CET)
- w linkach tak (i na koncu grafik), dlatego na samym początku podałem tak jak musi być, aby wyeliminować 2 kropki bez powodowania problemów --gregul 23:12, 13 sty 2007 (CET)
[edytuj] propozycje
==Link zewnętrzny== -> ==Linki zewnętrzne== ==Link zewnętrzny:== -> ==Linki zewnętrzne== == Link zewnętrzny == -> ==Linki zewnętrzne== == Link zewnętrzny: == -> ==Linki zewnętrzne==
==Trivia== -> ==Ciekawostki== ==Trivia:== -> ==Ciekawostki== == Trivia == -> ==Ciekawostki== == Trivia: == -> ==Ciekawostki==
Tyle na razie. =} -- kocio ✉ 10:36, 23 sty 2007 (CET)
- dobrze by było zgłaszać błędy, które pojawiają się masowo – te 4 kombinacje z "trivia" występują w przestrzeni głównej raptem 9 razy, ale za to takie: 1999r 1999r. 1999 r itp. znajdują się w ponad 1,5 tys. artykułów gregul 18:52, 23 sty 2007 (CET)
Ja bym dodał jeszcze <br>:
<Br> -> <br> <BR> -> <br> <br /> -> <br> <br/> -> <br>
Yarl read.me 15:30, 24 sty 2007 (CET)
- podlinkuję temat [1], dobrze by było wyjaśnić --gregul 15:57, 24 sty 2007 (CET)
- Proszę mnie oświecić: Wiki chodzi na XML, więc powinno być "<br />" i tak wstawiam konsekwentnie. Czy się mylę? Grzegorz Wysocki 相撲 (NAPISZ) 00:24, 31 mar 2007 (CEST)
[edytuj] Sprzątanie nagłówków
Z racji tego ze widziałem juz nagłówek dziewiątego poziomu "=========" to czy była by możliwość zmniejszenia powiedzmy nagłówków od 5 poziomu ? ( na 4 ) albo wyfiltrowanie tych nagłówków do jednej listy która by byłą udostępniona i dałoby się ją sprawdzić ręcznie ? --Pmgpmg (dyskusja) 15:53, 1 kwi 2007 (CEST)
[edytuj] "r." → " r."
Chodzi o bardzo powszechny (dziesiątki? setki?) błąd pisania skrótu "r." bez spacji po cyferkach roku. Przykład z błędem: 1998r. poprawnie: 1998 r.. Jest to częsty błąd, możliwe, że niektórym się już "opatrzył" i nie zauważają go. Skopiowano z: Wikipedia:Zadania dla botów#Masowe_poprawki_interpunkcji Rozek19 (odpowiedz) 22:34, 30 kwi 2007 (CEST)
[edytuj] Kilka zadań
- Poprawa reszty przestrzeni nazw w linkach, jeśli są wpisane po angielsku, lub z małej litery.
- Konwersja znaczników HTML mających odpowiednik w formatowaniu wiki
- <b> i </b> na '''
- <i> i </i> na ''
- <hr> i <hr /> na ----
- <h1>coś</h1>, <h2>coś</h2>, <h3>coś</h3> na ==coś==, ===coś===, ====coś====
- wycinanie pierwszej linii artykułu jeśli ma treść ==Nazwa artykułu==, <h1>Nazwa artykułu</h1>, lub '''Nazwa artykułu'''
- linie o treści "*[http://nazwa.costam]" na "*[http://nazwa.costam http://nazwa.costam]"
- usuwanie spacjii na początku pierwszej lini.
- "[[ Cośtam]]" na " [[Cośtam]]" i "[[Cośtam1| Cośtam2]]" na " [[Cośtam1|Cośtam]]" i "[[ Cośtam1| Cośtam2]]" na " [[Cośtam1|Cośtam]]"
Pozdrawiam.--Witek1988 (Dyskusja) 20:11, 3 maja 2007 (CEST)
[edytuj] Powszechne błędy językowe
Myślę, że może się przydać: Wikipedia:Lista najczęstszych błędów pisowni, Pomoc:Powszechne błędy językowe. Yarl read.me 17:13, 20 maja 2007 (CEST)
- A ja myślę że się nie przyda. Część tzw. błędów może być użyta celowo, np. w cytatach, w zdaniach staropolskich, bądź też to mogą być nazwy własne. Potrafisz znaleźć sposób by rozróżnić botem takie sytuacje? Zresztą co do użycia bota do poprawek lingwistycznych, że tak je nazwę, toczyła nie raz się już dyskusja i wnioski są zawsze takie same - nie używać. Argumentów przeciwnych jest cała masa, a argumentów za praktycznie brak. Lepiej poprawiać takie błędy językowe ręcznie, najczęściej w art. jest więcej takich błędów to i inne się przy okazji poprawi. Pozdrawiam A_Bach - ΣΦ 17:41, 20 maja 2007 (CEST)
[edytuj] Usuwanie pustych linii
Ja bym bardzo prosiła, by w zakres czyszczenia kodu nie wchodziło usuwanie pustych linii, o ile nie ich więcej niż 3. Nie wiem, jak to wygląda pod innymi przeglądarkami, ale pod IE dodatkowa linia jest często spowodowane koniecznością dodania odstępu np. między tekstem a szablonem czy między tekstem a spisem treści (bez pustej linii ramka niemal dotyka do tekstu, co optycznie wygląda fatalnie). Gytha 23:31, 1 lip 2007 (CEST)
To jest sprawa poprawienia innych mechanizmów Wikipedii. Wielokrotne puste linie są zawsze błędem. Beno @ 20:01, 7 sie 2007 (CEST)
- Mnie też przeszkadza ta funkcja WP:SK. Można by usunąć usuwanie linii sprzed szablonów przynajmniej. Rozumiem, że tak nie jest najpoprawniej, ale nie wiem, jak i gdzie te mechanizmy poprawić - może ktoś wie? ToSter→¿? 11:33, 9 maj 2008 (CEST)
[edytuj] Link FA
Byłoby logiczniej, gdyby szablony {{Link FA}} nie były przenoszone ponad kategorie, tylko pozostawały tuż nad linkami interwiki, skoro do nich się odnoszą. --Filemon 21:39, 2 lip 2007 (CEST)
- Popieram. Można je też segregować, jak same międzywiki. A dlaczego zmienia się ² i ³, a ¹ nie? BartekChom 21:29, 22 lis 2007 (CET)
[edytuj] spacje
to na tym ma polegać sprzątanie kodu, aby wstawiać dodatkowe spację między = = które i tak nie są wyświetlane, albo dodatkowe spację po #? [3] nie za bardzo jest to dla mnie jasne, jeśli chodzi o (1) to ja robie odwrotnie --gregul 14:02, 9 lip 2007 (CEST)
[edytuj] Moja wersja
Nux nie ruszył skryptu od września, więc stworzyłem własną wersję. Wikipedysta:BartekChom/wp sk.js Kto chce, może używać. Pierwsza sprawa: czy przywrócenie
*punkt -> * punkt
nie przeszkadza? BartekChom (dyskusja) 21:31, 6 gru 2007 (CET)
- Tylko, że teraz nie działa. Nie radzę sobie z {{link FA}} BartekChom (dyskusja) 21:53, 6 gru 2007 (CET)
- Już działa. BartekChom (dyskusja) 22:17, 7 gru 2007 (CET)
[edytuj] może jeszcze kolejnośc alfabetyczna kategorii
Witam!
Skrypt jako przycisk (gadżet) świetny! Mam tylko jedno małe "ale" - dodałbym jeszcze funkcjonalność, którą zapisałem w tytule - czyli alfabetyczne ustawianie kategorii pod koniec artykułu, niby nic (w sumie tylko zalecenie), ale czasami zdarza się mi (i nie tylko mi) to ręcznie robić... Pozdrawiam! --Wiher dyskusja 00:54, 29 gru 2007 (CET)
kategorie nie powinny być alfabetycznie tylko od najważniejszej do mniej ważnych, gdyż ich kolejność wyświetlania gra rolę --gregul (dyskusja) 02:56, 29 gru 2007 (CET)
[edytuj] Może jeszcze stulecia
Mnie dla odmiany drażni linkowanie typu XIV, albo co gorsza XIV w. zamiast [[XIV wiek|XIV]]. Można prosić o dopisanie tej linijki kodu? Lajsikonik Dyskusja 07:23, 3 mar 2008 (CET)
[edytuj] myślnik a łącznik
Czy można by dodać zamianę niepoprawnie używanego łącznika ("-") na myślnik ("–")? Oczywiście tylko, kiedy jest otoczony spacjami, a więc " - " -> " – ". Ten błąd interpunkcyjny jest chyba w około połowie artykułów wikipedii ;) ToSter (dyskusja) 01:58, 17 mar 2008 (CET)
- Tu wątpię, aby każdy " - " należało zamienić na łącznik. A_Bach - ΣΦ 09:23, 17 mar 2008 (CET)
- No ja też się zastanawiam, na razie jedyny wyjątek znalazłem w Pauza (znak typograficzny), ale można by to jakoś obejść. W artykułach matematycznych zamiast " - " powinien być wg tego artykułu minus, który jest jeszcze czym innym. Tak czy inaczej, wszędzie walają się dywizy zamiast myślników i nie bardzo wiem, czy da się z tym coś zrobić – może jakoś usprawnić okienko do edycji, żeby nie trzeba było zjeżdżać w dół strony, by wstawić myślnik? ToSter (dyskusja) 09:55, 17 mar 2008 (CET)
[edytuj] nawiasy, przecinki i spacje
proponuję zamieniać:
- nawiasy
tekst(tekst -> tekst (tekst tekst)tekst -> tekst) tekst tekst ( tekst -> tekst (tekst tekst ) tekst -> tekst) tekst
- przecinki
tekst,tekst -> tekst, tekst tekst , tekst -> tekst, tekst
- pytajniki
tekst?Tekst -> tekst? Tekst tekst ? Tekst -> tekst? Tekst
Nie jestem do końca przekonany czy cośtakiego powinno być - ja rozumiem że to jest przydatne, ale nie sprawdza się w cytatach. Beno na pewno byłby przeciw. PMG (dyskusja) 16:58, 12 kwi 2008 (CEST)
- Szukałem, ale nie znalazłem. Możesz podrzucić linki do cytatów, w których to się nie sprawdzi? Błąd jest bardzo powszechny (ale nie potrafię wyszukać liczby wystąpień) i nawet gdyby w kilku cytatach coś było nie tak IMHO warto. A te kilka cytatów? Łatwo wyłapać przy przeglądaniu zmian kodu. Wbartoszy (dyskusja) 06:43, 13 kwi 2008 (CEST)
[edytuj] Omijanie części strony
Czy jakaś mądra głowa regex-owa byłaby w stanie nauczyć skrypt, żeby:
- nie zmieniał nic w sekcjach <pre>, <source> i w liniach zaczynających się od spacji (to działa jak pre)?
- nie zmieniał nic w nazwach plików (głównie graficznych)?
- jeśli idzie o zamianę dywizu na półpauzę - rzeczywiście pomiędzy liczbami zazwyczaj to się dziać nie powinno, można za to zmieniać "1987 - 1989" na "1987-1989". Warto też wziąć poprawkę na to, że daty często są linkami i "1987 - 1989" też warto poprawić. Wyjątki od tej reguły powstają, kiedy występuje coś takiego: "w roku 1987 - 40 osób" i nie wiem, czy to da się obejść.
ToSter→¿? 11:31, 9 maj 2008 (CEST)
- co do dat to da się, wystarczy a) zmieniać do postaci 1987-1989 liczby 3- lub 4-cyfrowe, które są obie zlinkowane b) poprawiać ciągi w postaci lat.{0,3} \d+ *[-–] *\d+ c) wykluczać początki wiersza zaczynające się np. od gwiazdki, gdzie często są wyliczenia ile czego było w danym roku, i to są główne warianty, które będą działały bezbłędnie --gregul (dyskusja) 20:39, 9 maj 2008 (CEST)
[edytuj] linki do przekierowań
Czy możliwe jest aby sprzątanie kodu umożliwiało poprawę linków do stron które są redirectami na linki do stron docelowych? Chodzi mi o to że jeżeli na jakiejś stronie występuje S/Y Politechnika (czy Politechniki), winno to być zmienione na SY Politechnika (czy Politechniki) Wbartoszy (dyskusja) 11:50, 13 maj 2008 (CEST)
- Wydaje mi się, że to niemożliwe bez użycia AJAX - w kodzie HTML strony linki będące redirectami mają własną klasę i da się je jakoś wychwycić, ale nie ma możliwości dowiedzenia się, do czego przekierowują. ToSter→¿? 11:59, 13 maj 2008 (CEST)
[edytuj] naprawa błędnych skrótów
Dość powszechnie występujące błędy w skrótach:
- właść. → właśc.
- tyś. → tys.
Chrumps ► 18:53, 20 cze 2008 (CEST)
[edytuj] Błąd skryptu
W skrypcie "Czyszczenie kodu" jest błąd.
W szablonach występuje fragment który nie jest dodawany do artykułu ale jest kodem skryptu. Jeżeli w takim kodzie są kategorie to są przenoszone na koniec.
Przykład.
Przed czyszeniem:
<noinclude> [[en:Template:Province of Trento]] </noinclude>
Po czyszczeniu:
<noinclude> </noinclude> [[en:Template:Province of Trento]]